Uitwerking Tentamen Datamining (2II15) 26/06/09

Maat: px
Weergave met pagina beginnen:

Download "Uitwerking Tentamen Datamining (2II15) 26/06/09"

Transcriptie

1 Uitwerking Tentamen Datamining (2II15) 26/06/09 1. (3p) (Clustering) Welke van de volgende uitspraken zijn correct? Voor de correcte uitspraken: leg uit, voor de incorrecte: geef een tegenvoorbeeld. (a) Het k-means algoritme met de Euclidische afstandsmaat zal steeds convergeren, maar niet altijd naar dezelfde oplossing. Oplossing: Deze uitspraak is correct. Er is maar een eindig aantal keuzes voor de k cluster centroids (centroids worden bepaald als het gemiddelde van de cluster en het aantal clusters is beperkt tot het aantal deelverzamelingen van de relatie die geclusterd wordt). Bovendien daalt in elke iteratie van het k-means de SSE (sum of squared errors). Het algoritme stopt als de SSE twee iteraties na elkaar niet verandert. (b) Het DBSCAN algoritme convergeert steeds naar dezelfde oplossing, onafhankelijk van de ordening van de tuples in de relatie die geclusterd wordt. Oplossing: Deze uitspraak is niet waar; border-punten kunnen mogelijk densityreachable zijn vanuit twee core punten die zelf niet density-connected zijn. Afhankelijk van welk core-punt als eerste gekozen wordt zal het border punt tot de cluster met het ene dan wel het andere core-punt behoren. Een voorbeeld hiervan: Deze figuur toont 11 punten. De drie cirkels geven de afstand ɛ aan voor de drie middelste punten. Veronderstel dat minpts = 4. Afhankelijk van de volgorde waarin de punten beschouwd worden zal nu het middelste punt tot de linkse dan wel tot de rechtse cluster behoren. (c) Zowel k-means als DBSCAN zijn enkel geschikt om laag-dimensionale data te clusteren. Oplossing: Dit is niet waar. Met de correcte afstandsmaat kunnen beide algoritmes ook hoog-dimensionale data clusteren. De dimensionaliteit is vooral een probleem voor de afstandsmaten en niet voor de clustering-algoritmes zelf. De essentie hier is uiteraard de identificatie van het mogelijke probleem met afstandsmaten. Daarom werden antwoorden waarbij duidelijk het gebruik van de Euclidische afstandsmaat verondersteld werd ook goedgekeurd.

2 2. (3p) Beschouw de volgende dataset: TID Items 1 appel, banaan, bier, chips, melk, rum 2 banaan, bier, rum, peer 3 chips, melk, peer 4 banaan, melk, strip 5 appel, banaan, chips, rum, peer 6 banaan, melk, rum, strip 7 bier, chips, melk, rum 8 chips, rum, strip 9 appel, peer 10 banaan, bier, chips, rum (a) Illustreer het Apriori-algoritme door te tonen hoe dit algoritme alle itemsets met een minimale support van 50% in deze dataset vindt. Oplossing: In de eerste stap genereert het Apriori-algoritme alle sets van grootte 1: C 1 = {{appel}, {banaan}, {bier}, {chips}, {melk}, {rum}, {peer}, {strip}} Deze sets worden samen in 1 scan over de database geteld: De frequente 1-itemsets zijn dus: {appel}: 30% {banaan}: 60% {bier} : 40% {chips} : 60% {melk} : 50% {rum} : 70% {peer} : 40% {strip} : 30% F 1 = {{{banaan}, {chips}, {melk}, {rum}} Enkel die sets van lengte 2 waarvoor geldt dat al hun deelverzamelingen van lengte 1 frequent zijn worden als kandidaat beschouwd: C 2 = {{banaan, chips}, {banaan, melk}, {banaan, rum}, {chips, melk}, {chips, rum}, {melk, rum}} Deze sets worden samen in 1 scan over de database geteld: De frequente 2-itemsets zijn dus: {banaan,chips}: 30% {banaan,melk}: 30% {banaan,rum} : 50% {chips,melk} : 30% {chips,rum} : 50% {melk,rum} : 30% F 2 = {{banaan, rum}, {chips, rum}} Er worden geen kandidaten van lengte 3 gegenereerd, aangezien elke set van lengte 3 minstens 1 niet-frequente subset van lengte 2 heeft en dus wordt weggesnoeid. De uiteindelijke set van frequente itemsets is: F = {{}, {banaan}, {chips}, {melk}, {rum}, {banaan, rum}, {chips, rum}}

3 (b) Geef van elk de volgende constraints aan hoe ze efficiënt gebruikt kunnen worden bij het minen naar associatie-regels X Y. (Hint: het minen van associatie-regels wordt meestal opgesplitst in eerst het minen van de frequente itemsets en daarna het opdelen van de frequente itemsets in linker- en rechterkant van de regels. De constraints kunnen al in de eerste faze nuttig gebruikt worden.) X bevat banaan, X noch Y bevatten appel, Y bevat minstens een van de dranken (bier, melk of rum), X Y bevat minstens 3 items. Oplossing: X bevat banaan: verwijder alle transacties uit de database die geen banaan bevatten. Mine in deze gereduceerde dataset alle itemsets met dezelfde absolute minimale support als in de originele dataset. X noch Y bevatten appel: verwijder alle appels uit de database. Alle transacties met appel erin verwijderen is uiteraard fout. Y bevat minstens een van de dranken (bier, melk of rum): het verwijderen van alle transacties uit de database die geen enkele van de drie dranken bevatten, zoals dat wel kon voor banaan, is fout. Bij het bepalen van de confidence van de regel X Y hebben we de support van X nodig. Als we alle transacties zonder drank verwijderd hebben, dan wordt de support van X foutief berekend; de eigenschap waarop het schrappen van de transacties met drank gebaseerd is, is namelijk: als we alle transacties zonder drank verwijderen, verandert de absolute support van een itemset met een drank erin, niet. Dus: ofwel wordt deze constraint pas in de tweede faze uitgebuit door enkel frequente itemsets met een drank in op te splitsen en dit zo te doen dat deze drank in Y zit, of door eerst enkel de frequente itemsets met een van de dranken in de zoeken (nu kunnen wel de transacties zonder drank verwijderd worden) en daarna in een faze 1(b) de frequenties van alle subsets van deze sets zonder een drank erin te zoeken in de database waar de transacties zonder drank niet verwijderd zijn. Een voorbeeld: stel de database is: {(1, {rum, chips}), (2, {chips})} Als we eerst alle transacties zonder drank weghalen krijgen we: {(1, {rum, chips})} In deze dataset heeft chips een support van 1, wat leidt tot de foutieve conclusie dat de associatieregel chips rum een confidence van 1 heeft. X Y bevat minstens 3 items: om dezelfde reden als in het vorige punt is het verwijderen van alle transacties met minstens 3 items fout. Dus, opnieuw: deze constraint pas in de tweede faze uitbuiten door enkel frequente itemsets van lengte 3 op te splitsen, of door eerst enkel de frequente itemsets van minstens lengte 3 te zoeken en daarna in een faze 1(b) de frequenties van alle subsets van deze sets zoeken in de originele database. Voor oplossingen waar gekozen werd voor uitbuiting van de constraints in de tweede faze werd slechts 1 keer.25 punt toegekend.

4 (c) Zoek in deze dataset alle associatie-regels X Y met een minimale support van 30% en een minimale confidence van 80% die aan alle constraints uit (b) voldoen. Oplossing: We buiten eerst de constraints uit die zowel voor X als X Y gelden, zijnde: X (en dus ook X Y ) bevat banaan, X noch Y (en dus ook X Y niet) bevatten appel en de support van de regel X Y (en dus, bij definitie, de support van X Y en door het monotoniciteits principe X) is minstens 30%. Door het toepassen van de strategie beschreven in (b) kunnen we achtereenvolgens: i. alle transacties zonder banaan verwijderen (3, 7, 8 en 9) ii. het item appel uit alle overgebleven transacties verwijderen (constraint 2) iii. de items strip en peer verwijderen (wegens te lage frequentie) Dit geeft ons volgende gereduceerde database: D 2 := TID Items 1 banaan, bier, chips, melk, rum 2 banaan, bier, rum 4 banaan, melk 5 banaan, chips, rum 6 banaan, melk, rum 10 banaan, bier, chips, rum De associatieregels met support 30% en confidence 80% in de originele database die voldoen aan de constraints zijn exact dezelfde als in deze nieuwe met een minimale absolute support van 3 en een minimale confidence van 80%. We zouden nu in deze database alle frequente itemsets kunnen minen, maar om het werk verder te verminderen zullen we de strategie toepassen om eerst alle X Y te vinden en daarna de frequenties van de X-en die we nog missen te zoeken. Op X Y liggen nog bijkomende constraints: minstens een van de dranken moet aanwezig zijn en de lengte van de itemset moet minstens 3 zijn. We kunnen dus nog bijkomend volgende acties doen: i. alle te korte transacties verwijderen (enkel 4) ii. item melk verwijderen (te lage absolute support van 2) iii. opnieuw te korte transactie verwijderen (6) Dit levert volgende database op: D 3 := TID Items 1 banaan, bier, chips, rum 2 banaan, bier, rum 5 banaan, chips, rum 10 banaan, bier, chips, rum De itemsets van lengte 3 of meer zonder appel, met banaan, met een minimale absolute support van 3 die minstens een van de drie dranken bevatten zijn dezelfde als in de originele database. Zelfs hun support is hetzelfde. Merk op dat alle transacties zowel rum als banaan bevatten. In deze database geldt dus voor elke itemset I dat support(i) = support(i {banaan}) = support(i {rum}) = support(i {rum, banaan}) Daarom zoeken we enkel de frequente itemsets zonder deze twee items en vullen achteraf aan met alle combinaties van banaan en rum. Het is nu eenvoudig om te zien dat enkel de volgende itemsets zonder banaan en rum frequent zijn: {} : 4, {bier} : 3, {chips} : 3

5 Dus, de enige itemsets van lengte minstens 3 die een minimale absolute support van minimaal 3 hebben in deze dataset zijn: {banaan, bier, rum} : 3, {banaan, chips, rum} : 3 Nu moeten we nog alle supports van de subsets X met banaan van deze twee sets zoeken in D 2 (!! niet in D 3!! Door een gelukkig toeval kwam dit in deze database wel op hetzelfde neer). Dit levert volgende supports: {banaan} : 6, {banaan, bier} : 3, {banaan, rum} : 5, {banaan, chips} : 3 We hebben dus enkel volgende twee association rules met minimale support 30% en minimale confidence 80% die aan alle constraints voldoen: {banaan, bier} {rum} {banaan, chips} {rum}

6 3. (4p) Een onderzoeksteam stelt een nieuw algoritme voor om categorische data te classificeren. Hun onderzoeksresultaten zijn beschreven in de bijlage. Lees deze bijlage aandachtig en maak een kritische analyse van het onderzoek. (a) Algoritme. Zijn de keuzes voor de classificatie algoritmes (Naive Bayes en Nearest Neighbor met Euclidische afstand) logisch? Leg uit. (b) Experimenten. Is de experimentele opzet correct? In het bijzonder, is wat gemeten wordt relevant en ondersteunen de experimenten de claims die gemaakt worden? (c) Conclusies. Zijn de conclusies en de gegeven verklaringen correct? Indien niet, waarom? Geef voor elk negatief punt kort aan hoe dit opgelost zou kunnen worden. Bij een uitzonderlijk goed antwoord op deze vraag kan een bonus-punt verdiend worden. Oplossing: Omdat verschillende problemen zowel onder (a), (b), als (c) konden geplaatst worden, splitsen we de lijst niet volgens deze categorieën op. Mogelijke oplossingen zijn in italics gegeven. We identificeren drie grote problemen (elk 1 punt waard): De keuze voor het gebruik van de Euclidische afstand is zonder meer desastreus. Deze afstandsmaat is absoluut niet geschikt voor zulke hoog-dimensionale data en levert quasi random resultaten op. Dit kan trouwens goed gezien worden in de experimenten: 75% van de mails is spam en 25% is niet-spam. Indien de afstandsmaat random is zou je dus verwachten dat in 75% van de gevallen de dichtste buur spam is en in 25% nonspam. Het label spam is in 75% van de gevallen het correcte label tegen 25% voor nietspam. De te verwachten accuraatheid bij 1-NN met een random afstandsmaat is dus: (0, 75) 2 + (0, 25) 2 = 62, 5%. Bij 10-NN of 100-NN wordt het meest voorkomende label van de 10 respectievelijk 100 dichtste buren voorspeld. In het geval van een random afstandsmaat zal dit bijna altijd het label spam zijn, wat in 75% van de gevallen correct is. De accuraatheden verkregen in de experimenten bevestigen deze trend. Sowieso is het heel erg verdacht als 1-NN slechter scoort dan de baseline classifier die steeds de grootste klasse voorspelt. De daling in accuraatheid van de NN classifier is dus waarschijnlijk helemaal niet te wijten aan ruis (hoewel de stelling minder buren leidt tot hogere gevoeligheid voor ruis wel correct is). De hogere accuraatheid bij een hoger aantal buren is in dit geval naar alle waarschijnlijkheid enkel en alleen te wijten aan het feit dat bij een hoger aantal buren en een random afstandsmaat, NN steeds dichter bij de base-line classifier komt. Gebruik een andere afstandsmaat, b.v.b. Jaccard, SMC, cosine, weighted Euclidian distance (let op: optimalisatie gewichten binnen cross-validatie doen) Elk van de afzonderlijke experimenten is correct uitgevoerd met cross-validation, maar de optimalisatie van de parameters (minimale support en aantal buren) gebeurt buiten de test procedure. Als dusdanig kunnen we geen besluiten trekken over de verschillende parameter settings heen; de experimenten ondersteunen de claim van 81% accuraatheid voor de Naive Bayes classifier en 77% voor de Nearest neighbor classifier niet. Let op: het probleem hier is niet dat in de afzonderlijke experimenten dezelfde data wordt gebruikt voor testen en trainen. 10-fold cross validation is een perfect veilige bescherming tegen over-fitting en is zelfs een betere methode dan opsplitsen in een test- en training-set. Houd een deel van de data apart en test daarop enkel de meest veelbelovende parameter setting met cross-validatie.

7 Het totaal ontbreken van enig vergelijkingspunt is een duidelijk gemis in deze methode. Hoe kan men nu serieus claimen dat de methode veelbelovend is indien ze niet eens vergeleken wordt met de Naive Bayes en NN classifiers uitgevoerd op de oorspronkelijke, niet-aangepaste dataset? Misschien (waarschijnlijk zelfs) is de aanpassing om eerst de dataset te transformeren zelfs nadelig voor de accuraatheid! Een simpele vergelijking met de baseline classifier (die steeds spam voorspelt) leidt reeds tot de conclusie dat de resultaten helemaal niet zo fantastisch zijn; de baseline classifier heeft een accuraatheid van maar liefst 75%. De 77% van de NN classifier duidt als eerder op over-fitting omdat de parameter optimalisatie buiten de cross-validatie gehouden wordt. Ook bij de 81% kunnen vraagtekens geplaatst worden. Vergelijk met de baseline classifier en met classifiers op de originele database. Enkele kleinere punten (elk 0.5 punten waard) De keuze voor een even aantal buren bij NN (10 en 100) is niet logisch omdat dit betekent dat we soms ties kunnen hebben in de voorspellingen: van de 10 dichtste buren zijn er 5 spam en 5 niet-spam. Gebruik 11 en 101. Op de keuze voor de Naive Bayes classifier valt weinig op te merken. Eventueel kan er opgemerkt worden dat de attributen niet class-independent zijn, maar dat is vaak zo in toepassingen waar deze methode dan toch goed scoort; vaak blijven de voorspellingen correct en is enkel de waarschijnlijkheid die berekend wordt minder betrouwbaar. De keuze om frequente itemsets te gebruiken is vrij ongelukkig. Het valt te verwachten dat er weinig itemsets frequent gaan zijn die typisch voor niet-spam mails zijn aangezien zij maar 25% van de database uitmaken. Overigens zou het interessanter zijn om itemsets te scoren op het verschil in frequentie in beide klassen i.p.v. op frequentie over beide klassen heen. De relatief lage accuraatheid van de Naive Bayes classifier lijkt inderdaad te wijzen in de richting van een slechte attribuut-selectie. Selecteer de meest veelbelovende itemsets door hun correlatie met het klasse-attribuut te berekenen en enkel de hoogste te weerhouden. Voor het domein spam detectie is accuraatheid geen goede maat, omdat accuraatheid veronderstelt dat elk type van fout even belangrijk is. In deze dataset is dat echter niet het geval; een spam mail classificeren als niet-spam is minder erg dan omgekeerd. Al kan hier wel geargumenteerd worden dat de bedoeling van de experimenten in de eerste plaats het valideren van de methode is, eerder dan een zo goed mogelijke classifier voor spam mails te maken. Bij de laatste conclusie is de verklaring nonsens: de Naive Bayes classifier heeft helemaal geen last van onafhankelijke of grote aantallen attributen. Hoewel het terugdringen van het aantal features (in dit geval het aantal maximale frequente itemsets) een bijzonder goed idee is, zal het nemen van enkel closed maximal itemsets weinig soelaas bieden; elke maximaal frequente itemset is closed aangezien een maximaal frequente itemset zelf frequent is en al zijn subsets infrequent zijn en dus niet dezelfde support kunnen hebben. Ook lijken de auteurs van het rapport impliciet aan te nemen dat het aantal maximale sets steeds zal dalen indien de minimale support stijgt, maar dat hoeft helemaal zo niet te zijn. Daarnaast werden nog aanvullende puntjes gegeven die ook elk 0.5 punten opleverden indien correct/aannemelijk.

Oplossingen Datamining 2II15 Juni 2008

Oplossingen Datamining 2II15 Juni 2008 Oplossingen Datamining II1 Juni 008 1. (Associatieregels) (a) Zijn de volgende beweringen juist of fout? Geef een korte verklaring voor alle juiste beweringen en een tegenvoorbeeld voor alle foute be-weringen:

Nadere informatie

2. Geef een voorbeeld van hoe datamining gebruikt kan worden om frauduleuze geldtransacties te identificeren.

2. Geef een voorbeeld van hoe datamining gebruikt kan worden om frauduleuze geldtransacties te identificeren. 1. Veronderstel dat je als datamining consultant werkt voor een Internet Search Engine bedrijf. Beschrijf hoe datamining het bedrijf kan helpen door voorbeelden te geven van specifieke toepassingen van

Nadere informatie

Tentamen Data Mining

Tentamen Data Mining Tentamen Data Mining Algemene Opmerkingen Dit is geen open boek tentamen, noch mogen er aantekeningen gebruikt worden. Laat bij het uitvoeren van berekeningen zien hoe je aan een antwoord gekomen bent.

Nadere informatie

Tentamen Data Mining. Algemene Opmerkingen. Opgave L. Korte vragen (L6 punten) Tijd: 14:00-17:00. Datum: 4januai20l6

Tentamen Data Mining. Algemene Opmerkingen. Opgave L. Korte vragen (L6 punten) Tijd: 14:00-17:00. Datum: 4januai20l6 Tentamen Data Mining Datum: 4januai2l6 Tijd: 4: - 7: Algemene Opmerkingen e Dit is geen open boek tentamen, noch mogen er aantekeningen gebruikt worden. o Laat bij het uitvoeren van berekeningen zien hoeje

Nadere informatie

Classification - Prediction

Classification - Prediction Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training

Nadere informatie

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016:

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016: Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016: 11.00-13.00 Algemene aanwijzingen 1. Het is toegestaan een aan beide zijden beschreven A4 met aantekeningen te raadplegen. 2. Het is toegestaan

Nadere informatie

Data Mining: Clustering

Data Mining: Clustering Data Mining: Clustering docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Wat is clustering? Het onderverdelen van de objecten in een database in homogene

Nadere informatie

Data Mining: Classificatie

Data Mining: Classificatie Data Mining: Classificatie docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Overzicht Wat is classificatie? Leren van een beslissingsboom. Problemen

Nadere informatie

DATA MINING (TI2730-C)

DATA MINING (TI2730-C) Technische Universiteit Delft Elektrotechniek, Wiskunde en Informatica Secties: Pattern Recognition & Bioinformatics & Multimedia Signal Processing DATA MINING (TI2730-C) Schriftelijk (her)tentomen. Dinsdag

Nadere informatie

Toets deel 2 Data-analyse en retrieval Vrijdag 30 Juni 2017:

Toets deel 2 Data-analyse en retrieval Vrijdag 30 Juni 2017: Toets deel 2 Data-analyse en retrieval Vrijdag 30 Juni 2017: 11.00-13.00 Algemene aanwijzingen 1. Het is toegestaan een aan beide zijden beschreven A4 met aantekeningen te raadplegen. 2. Het is toegestaan

Nadere informatie

twee partijen zijn. Aangezien het bij data mining gaat om grote hoeveelheden data is het belangrijk om praktische oplossingen te hebben.

twee partijen zijn. Aangezien het bij data mining gaat om grote hoeveelheden data is het belangrijk om praktische oplossingen te hebben. Samenvatting Deze thesis handelt over privacy preserving data mining. Data mining is een tak van de wetenschap waarin men grote hoeveelheden data onderzoekt met de bedoeling er bepaalde patronen in te

Nadere informatie

Tentamen Kunstmatige Intelligentie (INFOB2KI)

Tentamen Kunstmatige Intelligentie (INFOB2KI) Tentamen Kunstmatige Intelligentie (INFOB2KI) 12 december 2014 8:30-10:30 Vooraf Mobiele telefoons en dergelijke dienen uitgeschakeld te zijn. Het eerste deel van het tentamen bestaat uit 8 multiple-choice

Nadere informatie

Uitgebreide uitwerking Tentamen Complexiteit, mei 2007

Uitgebreide uitwerking Tentamen Complexiteit, mei 2007 Uitgebreide uitwerking Tentamen Complexiteit, mei 007 Opgave. a. Een beslissingsboom beschrijft de werking van het betreffende algoritme (gebaseerd op arrayvergelijkingen) op elke mogelijke invoer. In

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd

Nadere informatie

Data mining Van boodschappenmandjes tot bio-informatica

Data mining Van boodschappenmandjes tot bio-informatica Data mining Van boodschappenmandjes tot bio-informatica Walter Kosters Informatica, Universiteit Leiden donderdag 6 april 2006 http://www.liacs.nl/home/kosters/ 1 Wat is Data mining? Data mining probeert

Nadere informatie

Computationele Intelligentie

Computationele Intelligentie Computationele Intelligentie Uitwerking werkcollege Representatie, Ongeïnformeerd zoeken, Heuristisch zoeken 1 lokkenwereld a. De zoekboom die door het dynamische breadth-first search algoritme wordt gegenereerd

Nadere informatie

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

Project Paper: Tiling problem

Project Paper: Tiling problem Project Paper: Tiling problem Groep 11: Said Hattachi, Ismael el Hadad Hakim, Muttalip Küçük Januari 015 Abstract Dit artikel beschrijft een heuristiek waarmee een veld op een systematische wijze gevuld

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

Uitleg van de Hough transformatie

Uitleg van de Hough transformatie Uitleg van de Hough transformatie Maarten M. Fokkinga, Joeri van Ruth Database groep, Fac. EWI, Universiteit Twente Versie van 17 mei 2005, 10:59 De Hough transformatie is een wiskundige techniek om een

Nadere informatie

Samenvatting De belangrijkste onderzoeksvraag waarop het werk in dit proefschrift een antwoord probeert te vinden, is welke typen taalkundige informatie het nuttigst zijn voor de lexicale desambiguatie

Nadere informatie

User Profile Repository Testrapportage kwaliteit

User Profile Repository Testrapportage kwaliteit CatchPlus User Profile Repository Testrapportage kwaliteit Versie 1.1 User Profile Repository Testrapportage kwaliteit Versie: 1.1 Publicatiedatum: 20-4-2012 Vertrouwelijk GridLine B.V., 2012 Pagina 1

Nadere informatie

Bachelor Project. Neuraal Winkelen

Bachelor Project. Neuraal Winkelen Bachelor Project Neuraal Winkelen Andrew Li Universiteit Leiden Leiden Institute of Advanced Computer Science Leiden, 2008 Samenvatting Dit verslag is een bachelorproject op het gebied van kunstmatige

Nadere informatie

1. Reductie van error variantie en dus verhogen van power op F-test

1. Reductie van error variantie en dus verhogen van power op F-test Werkboek 2013-2014 ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De

Nadere informatie

Toegepaste data-analyse: oefensessie 2

Toegepaste data-analyse: oefensessie 2 Toegepaste data-analyse: oefensessie 2 Depressie 1. Beschrijf de clustering van de dataset en geef aan op welk niveau de verschillende variabelen behoren Je moet weten hoe de data geclusterd zijn om uit

Nadere informatie

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse. Oefentoets 1 1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse. Conditie = experimenteel Conditie = controle Sekse = Vrouw 23 33 Sekse = Man 20 36 Van

Nadere informatie

Een prettig gesprek en het juiste antwoord

Een prettig gesprek en het juiste antwoord Quality Support BV Keerweer 14 6862 CE Oosterbeek www.quality-support.nl support@quality-support.nl T 085 890 03 90 K.v.K. Utrecht nr. 3019223 Een prettig gesprek en het juiste antwoord Bewijs van relatie

Nadere informatie

Data Mining. Arno Siebes

Data Mining. Arno Siebes 1 X Data Mining Arno Siebes U en Databases 1 X Elke Nederlander zit in honderden databases: door uw bonuskaart weet AH precies wat U eet; elke keer dat U pint weet de bank waar U hoeveel geld uitgeeft;

Nadere informatie

Afstudeerproject Bachelor AI. Nicolaas Heyning en Wouter Suren

Afstudeerproject Bachelor AI. Nicolaas Heyning en Wouter Suren Afstudeerproject Bachelor AI Door : Nicolaas Heyning en Wouter Suren Project begeleider: Maarten van Someren Nicolaas Heyning 1 e Van der Helststraat 57-II 1073 AD, Amsterdam nheyning@gmail.com Wouter

Nadere informatie

Summary in Dutch 179

Summary in Dutch 179 Samenvatting Een belangrijke reden voor het uitvoeren van marktonderzoek is het proberen te achterhalen wat de wensen en ideeën van consumenten zijn met betrekking tot een produkt. De conjuncte analyse

Nadere informatie

Principe Maken van een Monte Carlo data-set populatie-parameters en standaarddeviaties standaarddeviatie van de bepaling statistische verdeling

Principe Maken van een Monte Carlo data-set populatie-parameters en standaarddeviaties standaarddeviatie van de bepaling statistische verdeling Monte Carlo simulatie In MW\Pharm versie 3.30 is een Monte Carlo simulatie-module toegevoegd. Met behulp van deze Monte Carlo procedure kan onder meer de betrouwbaarheid van de berekeningen van KinPop

Nadere informatie

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y 1 Regressie analyse Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y Regressie: wel een oorzakelijk verband verondersteld: X Y Voorbeeld

Nadere informatie

Een combinatorische oplossing voor vraag 10 van de LIMO 2010

Een combinatorische oplossing voor vraag 10 van de LIMO 2010 Een combinatorische oplossing voor vraag 10 van de LIMO 2010 Stijn Vermeeren (University of Leeds) 16 juni 2010 Samenvatting Probleem 10 van de Landelijke Interuniversitaire Mathematische Olympiade 2010vraagt

Nadere informatie

Doel. Spel. www.ihots.nl. Duur: - Groep - Individueel. Laat je inspireren door de voorbeeld vragen in deze spiekbrief.

Doel. Spel. www.ihots.nl. Duur: - Groep - Individueel. Laat je inspireren door de voorbeeld vragen in deze spiekbrief. www.ihots.nl Doel Laat je inspireren door de voorbeeld vragen in deze spiekbrief Spel Alle spellen Gebruik deze spiekbrief telkens wanneer je een spel start in de ihots app. Laat je inspireren door de

Nadere informatie

Continuous Learning in Computer Vision S.L. Pintea

Continuous Learning in Computer Vision S.L. Pintea Continuous Learning in Computer Vision S.L. Pintea Continuous Learning in Computer Vision Natura non facit saltus. Gottfried Leibniz Silvia-Laura Pintea Intelligent Sensory Information Systems University

Nadere informatie

Computationele Intelligentie

Computationele Intelligentie Computationele Intelligentie Uitwerking werkcollege Representatie, Ongeïnformeerd zoeken, Heuristisch zoeken 1 lokkenwereld a. De zoekboom die door het dynamische breadth-first search algoritme wordt gegenereerd

Nadere informatie

DE INVLOED VAN GELUK, PECH, BIED- EN SPEELTECHNIEK OP DE SCORE BIJ BRIDGE

DE INVLOED VAN GELUK, PECH, BIED- EN SPEELTECHNIEK OP DE SCORE BIJ BRIDGE DE INVLOED VAN GELUK, PECH, BIED- EN SPEELTECHNIEK OP DE SCORE BIJ BRIDGE Versiedatum: 30-8-2008 Jan Blaas Blz. 1 van 7 Versiedatum: 30-8-08 INHOUDSOPGAVE Inleiding... 3 Hoe groot is de invloed van pech

Nadere informatie

Data Mining: Opdracht 2

Data Mining: Opdracht 2 Data Mining: Opdracht 2 7 juli 2006 Egbert Kroese (#0134252) Paul Lammertsma (#0305235) Inhoudsopgave 1. De datasets...3 1.1 Iris...3 1.2 Vote...3 1.3 Autos...4 2. De algoritmen...4 2.1 Naive Bayes...4

Nadere informatie

Combinatorische Algoritmen: Binary Decision Diagrams, Deel III

Combinatorische Algoritmen: Binary Decision Diagrams, Deel III Combinatorische Algoritmen: Binary Decision Diagrams, Deel III Sjoerd van Egmond LIACS, Leiden University, The Netherlands svegmond@liacs.nl 2 juni 2010 Samenvatting Deze notitie beschrijft een nederlandse

Nadere informatie

Het Geheugen van Vlaanderen

Het Geheugen van Vlaanderen Het Geheugen van Vlaanderen Pieter Moors & Johan Wagemans Laboratorium voor Experimentele Psychologie (KU Leuven) Introductie Het Geheugen van Vlaanderen is een massa-experiment met als doel een zicht

Nadere informatie

l e x e voor alle e E

l e x e voor alle e E Geselecteerde uitwerkingen Werkcollege Introduceer beslissingsvariabelen x e met x e = als lijn e in de boom zit en anders x e = 0. De doelfunctie wordt: min e E l e x e Voor elke deelverzameling S V met

Nadere informatie

Samenstelling van de moedermelk van een aantal zoogdieren. Soort Vetten (%) Proteïnen (%)

Samenstelling van de moedermelk van een aantal zoogdieren. Soort Vetten (%) Proteïnen (%) Samenstelling van de moedermelk van een aantal zoogdieren Soort Vetten (%) Proteïnen (%) Paard 1.0 2.6 Ezel 1.4 1.7 Muildier 1.8 2.0 Kameel 3.4 3.5 Lama 3.2 3.9 Zebra 4.8 3.0 Schaap 6.4 5.6 Buffel 7.9

Nadere informatie

2.1.4 Oefenen. d. Je ziet hier twee weegschalen. Wat is het verschil tussen beide als het gaat om het aflezen van een gewicht?

2.1.4 Oefenen. d. Je ziet hier twee weegschalen. Wat is het verschil tussen beide als het gaat om het aflezen van een gewicht? 2.1.4 Oefenen Opgave 9 Bekijk de genoemde dataset GEGEVENS154LEERLINGEN. a. Hoe lang is het grootste meisje? En de grootste jongen? b. Welke lengtes komen het meeste voor? c. Is het berekenen van gemiddelden

Nadere informatie

Hoofdstuk 2: Verbanden

Hoofdstuk 2: Verbanden Hoofdstuk 2: Verbanden Inleiding In het gebruik van statistiek komen we vaak relaties tussen variabelen tegen. De focus van dit hoofdstuk ligt op het leren hoe deze relaties op grafische en numerieke wijze

Nadere informatie

A DATA-DISCOVERY JOURNEY

A DATA-DISCOVERY JOURNEY A DATA-DISCOVERY JOURNEY Waarom een data- discovery journey Je hebt een hoop data maar wat kun je er mee. Data is voor veel bedrijven nog een erg abstract begrip. Natuurlijk snapt iedereen dat informatie

Nadere informatie

Gaap, ja, nog een keer. In één variabele hebben we deze formule nu al een paar keer gezien:

Gaap, ja, nog een keer. In één variabele hebben we deze formule nu al een paar keer gezien: Van de opgaven met een letter en dus zonder nummer staat het antwoord achterin. De vragen met een nummer behoren tot het huiswerk. Spieken achterin helpt je niets in het beter snappen... 1 Stelling van

Nadere informatie

Wiskunde C vwo. Workshop Noordhoff wiskundecongres 19 november 2015 Jan Dijkhuis en Sabine de Waal. Programma

Wiskunde C vwo. Workshop Noordhoff wiskundecongres 19 november 2015 Jan Dijkhuis en Sabine de Waal. Programma Wiskunde C vwo Workshop Noordhoff wiskundecongres 19 november 2015 Jan Dijkhuis en Sabine de Waal Programma 1. Vorm en ruimte in Getal & Ruimte 2. Logisch redeneren in Getal & Ruimte 1. Examenprogramma

Nadere informatie

PROEFEXAMEN LINEAIRE ALGEBRA dinsdag 22 november 2016

PROEFEXAMEN LINEAIRE ALGEBRA dinsdag 22 november 2016 PROEFEXAMEN LINEAIRE ALGEBRA dinsdag 22 november 2016 1. Zi (R, V, +) een eindigdimensionale vectorruimte en veronderstel dat U en W deelruimten van V zin. Toon aan dat 2. Waar of fout? Argumenteer e antwoord.

Nadere informatie

Magidoku s en verborgen symmetrieën

Magidoku s en verborgen symmetrieën Uitwerking Puzzel 92-6 Magidoku s en verborgen symmetrieën Wobien Doyer Lieke de Rooij Een Latijns vierkant van orde n, is een vierkante matrix, gevuld met n verschillende symbolen waarvan elk precies

Nadere informatie

2 Data en datasets verwerken

2 Data en datasets verwerken Domein Statistiek en kansrekening havo A 2 Data en datasets verwerken 1 Data presenteren 1.4 Oefenen In opdracht van: Commissie Toekomst Wiskunde Onderwijs 1.4 Oefenen Opgave 9 Bekijk de genoemde dataset

Nadere informatie

Data Mining: Classificatie

Data Mining: Classificatie Data Mining: lassificatie docent: dr. Toon alders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Vorige les lassificatie: Het groeperen van objecten in voorgedefinieerde

Nadere informatie

De statespace van Small World Networks

De statespace van Small World Networks De statespace van Small World Networks Emiel Suilen, Daan van den Berg, Frank van Harmelen epsuilen@few.vu.nl, daanvandenberg1976@gmail.com, Frank.van.Harmelen@cs.vu.nl VRIJE UNIVERSITEIT AMSTERDAM 2 juli

Nadere informatie

Nationale Social Media Onderzoek 2019

Nationale Social Media Onderzoek 2019 Nationale Social Media Onderzoek 2019 Het grootste trendonderzoek van Nederland naar het gebruik en verwachtingen van social media #NSMO Uitgevoerd door: Newcom Research & Consultancy B.V. Auteurs: drs.

Nadere informatie

Transport-, Routing- en Schedulingproblemen. Wi4062TU / Wi487TU / a86g. Uitwerkingen 08-04-2005

Transport-, Routing- en Schedulingproblemen. Wi4062TU / Wi487TU / a86g. Uitwerkingen 08-04-2005 Transport-, Routing- en Schedulingproblemen Wi4062TU / Wi487TU / a86g Uitwerkingen 08-04-2005 1 Transportprobleem Onderdeel a Fabriek 1 kan 120 ton staal fabriceren in 40 uur. Voor fabriek 2 is dit 150

Nadere informatie

AI en Data mining. Van AI tot Data mining. dr. Walter Kosters, Universiteit Leiden. Gouda woensdag 17 oktober

AI en Data mining. Van AI tot Data mining. dr. Walter Kosters, Universiteit Leiden. Gouda woensdag 17 oktober AI en Data mining Van AI tot Data mining dr. Walter Kosters, Universiteit Leiden Gouda woensdag 17 oktober 2007 www.liacs.nl/home/kosters/ 1 Wat is Data mining? Data mining probeert interessante en (on)verwachte

Nadere informatie

Summary in Dutch. Samenvatting

Summary in Dutch. Samenvatting Samenvatting In de theorie van het menselijk kapitaal zijn kennis en gezondheid uitkomsten van bewuste investeringsbeslissingen. Veel van de keuzes hieromtrent lijken in de praktijk echter niet weldoordacht.

Nadere informatie

Tentamen combinatorische optimalisatie Tijd:

Tentamen combinatorische optimalisatie Tijd: Tentamen combinatorische optimalisatie 26-05-2014. Tijd: 9.00-11.30 Tentamen is met gesloten boek. Beschrijf bij elke opgave steeds het belangrijkste idee. Notatie en exacte formulering is van minder belang.

Nadere informatie

Datastructuren en Algoritmen

Datastructuren en Algoritmen Datastructuren en Algoritmen Tentamen Vrijdag 6 november 2015 13.30-16.30 Toelichting Bij dit tentamen mag je gebruik maken van een spiekbriefje van maximaal 2 kantjes. Verder mogen er geen hulpmiddelen

Nadere informatie

Data Mining: Inleiding

Data Mining: Inleiding Data Mining: Inleiding docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining 2II15: Data mining en kennissystemen Lessen: maandag 7de en 8ste uur in Auditorium

Nadere informatie

Gegevensverwerving en verwerking

Gegevensverwerving en verwerking Gegevensverwerving en verwerking Staalname - aantal stalen/replicaten - grootte staal - apparatuur Experimentele setup Bibliotheek Statistiek - beschrijvend - variantie-analyse - correlatie - regressie

Nadere informatie

Laag Vaardigheden Leerdoelen Formulering van vragen /opdrachten

Laag Vaardigheden Leerdoelen Formulering van vragen /opdrachten Blooms taxonomie Laag Vaardigheden Leerdoelen Formulering van vragen /opdrachten Evalueren Evalueren = de vaardigheid om de waarde van iets (literatuur, onderzoeksrapport, presentatie etc) te kunnen beoordelen

Nadere informatie

Cover Page. The handle holds various files of this Leiden University dissertation.

Cover Page. The handle   holds various files of this Leiden University dissertation. Cover Page The handle http://hdl.handle.net/1887/39638 holds various files of this Leiden University dissertation. Author: Pelt D.M. Title: Filter-based reconstruction methods for tomography Issue Date:

Nadere informatie

Tentamen Kunstmatige Intelligentie (INFOB2KI)

Tentamen Kunstmatige Intelligentie (INFOB2KI) Tentamen Kunstmatige Intelligentie (INFOB2KI) 30 januari 2014 10:30-12:30 Vooraf Mobiele telefoons dienen uitgeschakeld te zijn. Het tentamen bestaat uit 7 opgaven; in totaal kunnen er 100 punten behaald

Nadere informatie

Samenvatting Nederlands

Samenvatting Nederlands Samenvatting Nederlands 178 Samenvatting Mis het niet! Incomplete data kan waardevolle informatie bevatten In epidemiologisch onderzoek wordt veel gebruik gemaakt van vragenlijsten om data te verzamelen.

Nadere informatie

Taak 2: LP: simplex en sensitiviteitsanalyse Voorbeeld uitwerking

Taak 2: LP: simplex en sensitiviteitsanalyse Voorbeeld uitwerking Taak 2: LP: simplex en sensitiviteitsanalyse Voorbeeld uitwerking. Sensitiviteitsanalyse (a) Als de prijs van legering 5 daalt, kan het voordeliger worden om gebruik te maken van deze legering. Als de

Nadere informatie

Living Labs : NFI & RvdK Samen onderweg naar meer grip op data. JenV I-tour presentatie 24 april 2018

Living Labs : NFI & RvdK Samen onderweg naar meer grip op data. JenV I-tour presentatie 24 april 2018 Living Labs : NFI & RvdK Samen onderweg naar meer grip op data JenV I-tour presentatie 24 april 2018 1 Agenda Deel I - door Jannie RvdK Intermezzo filmpje I-plan JenV Deel II door Femke en Xandra NFI KInD

Nadere informatie

Samenvatting (Summary in Dutch)

Samenvatting (Summary in Dutch) In dit proefschrift worden een aantal psychometrische methoden beschreven waarmee de accuratesse en efficientie van psychodiagnostiek in de klinische praktijk verbeterd kan worden. Psychodiagnostiek wordt

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 10 Donderdag 14 Oktober 1 / 71 1 Kansrekening Indeling: Bayesiaans leren 2 / 71 Bayesiaans leren 3 / 71 Bayesiaans leren: spelletje Vb. Twee enveloppen met kralen, waarvan

Nadere informatie

Wiskunde 2 september 2008 versie 1-1 - Dit is een greep (combinatie) van 3 uit 32. De volgorde is niet van belang omdat de drie

Wiskunde 2 september 2008 versie 1-1 - Dit is een greep (combinatie) van 3 uit 32. De volgorde is niet van belang omdat de drie Wiskunde 2 september 2008 versie 1-1 - Op hoeveel verschillende manieren kun je drie zwarte pionnen verdelen over de 32 zwarte velden van een schaakbord? (Neem aan dat op elk veld hooguit één pion staat.)

Nadere informatie

Taxanomie van Bloom en de kunst van het vragen stellen. Anouk Mulder verschil in talent

Taxanomie van Bloom en de kunst van het vragen stellen. Anouk Mulder verschil in talent Onthouden Kunnen ophalen van specifieke informatie, variërend van feiten tot complete theorieën Opslaan en ophalen van informatie (herkennen) Kennis van data, gebeurtenissen, plaatsen Kennis van belangrijkste

Nadere informatie

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen. Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen. 1. (a) In de appendix van deze vraag, is een dataset gegeven met de corresponderende

Nadere informatie

Examen Algoritmen en Datastructuren III

Examen Algoritmen en Datastructuren III Derde bachelor Informatica Academiejaar 2008 2009, eerste zittijd Examen Algoritmen en Datastructuren III Naam :.............................................................................. Stellingen

Nadere informatie

Data Mining. Eindverslag 7 juni 2009

Data Mining. Eindverslag 7 juni 2009 Data Mining Eindverslag 7 juni 2009 Naam: Mathijs de Langen 0611699 Stijn Koopal 0613671 Marvin Raaijmakers 0608141 Giel Oerlemans 0607213 Email: m.a.d.langen@student.tue.nl s.koopal@student.tue.nl m.raaijmakers@student.tue.nl

Nadere informatie

TW2020 Optimalisering

TW2020 Optimalisering TW2020 Optimalisering Hoorcollege 8 Leo van Iersel Technische Universiteit Delft 2 november 2016 Leo van Iersel (TUD) TW2020 Optimalisering 2 november 2016 1 / 28 Minimum Opspannende Boom (Minimum Spanning

Nadere informatie

Grafen. Indien de uitgraad van ieder punt 1 is, dan bevat de graaf een cykel. Indien de ingraad van ieder punt 1 is, dan bevat de graaf een cykel.

Grafen. Indien de uitgraad van ieder punt 1 is, dan bevat de graaf een cykel. Indien de ingraad van ieder punt 1 is, dan bevat de graaf een cykel. Grafen Grafen Een graaf bestaat uit een verzameling punten (ook wel knopen, of in het engels vertices genoemd) en een verzameling kanten (edges) of pijlen (arcs), waarbij de kanten en pijlen tussen twee

Nadere informatie

vandaag is Annie twee jaar jonger dan Ben en Cees samen

vandaag is Annie twee jaar jonger dan Ben en Cees samen Hoofdstuk I Lineaire Algebra Les 1 Stelsels lineaire vergelijkingen Om te beginnen is hier een puzzeltje: vandaag is Annie twee jaar jonger dan Ben en Cees samen over vijf jaar is Annie twee keer zo oud

Nadere informatie

1 Vervangingsstrategie auto

1 Vervangingsstrategie auto Transport-, Routing- en Schedulingproblemen Wi4062TU / Wi487TU / a86g Uitwerkingen 28-03-2002 1 Vervangingsstrategie auto Onderdeel a Zij V = {0, 1, 2, 3, 4, 5, 6}, waarbij knoop i staat voor het einde

Nadere informatie

ˆ het voorkomen van bepaalde woorden in de body van de mail,

ˆ het voorkomen van bepaalde woorden in de body van de mail, Opdracht 1: Bayesiaanse Spam Filter Het doel van deze opdracht is het ontwerpen van een eenvoudige spam filter op basis van een Bayesiaans Netwerk. Je zal het model implementeren in Netica en het toepassen

Nadere informatie

toelatingsexamen-geneeskunde.be Gebaseerd op nota s tijdens het examen, daarom worden niet altijd antwoordmogelijkheden vermeld.

toelatingsexamen-geneeskunde.be Gebaseerd op nota s tijdens het examen, daarom worden niet altijd antwoordmogelijkheden vermeld. Wiskunde juli 2009 Laatste aanpassing: 29 juli 2009. Gebaseerd op nota s tijdens het examen, daarom worden niet altijd antwoordmogelijkheden vermeld. Vraag 1 Wat is de top van deze parabool 2 2. Vraag

Nadere informatie

Functie beschrijving: Het automatisch aanmaken van een raai-volgende contour

Functie beschrijving: Het automatisch aanmaken van een raai-volgende contour Modelit Rotterdamse Rijweg 126 3042 AS Rotterdam Telefoon +31 10 4623621 info@modelit.nl www.modelit.nl Functie beschrijving: Het automatisch aanmaken van een raai-volgende contour Datum 8 Mei 2004 Modelit

Nadere informatie

Stoeien met Statistiek

Stoeien met Statistiek Stoeien met Statistiek Havo 4: Statistiek op grote datasets 2 Inhoudsopgave Achtergrondinformatie... 4 Docentenhandleiding... 5 Inleiding voor leerlingen... 6 Opdracht 1... 7 Opdracht 2... 8 Opdracht 3...

Nadere informatie

Uitwerking tentamen Analyse van Algoritmen, 29 januari

Uitwerking tentamen Analyse van Algoritmen, 29 januari Uitwerking tentamen Analyse van Algoritmen, 29 januari 2007. (a) De buitenste for-lus kent N = 5 iteraties. Na iedere iteratie ziet de rij getallen er als volgt uit: i rij na i e iteratie 2 5 4 6 2 2 4

Nadere informatie

De basiselementen van Markov-ketens zijn:

De basiselementen van Markov-ketens zijn: Contact Dit document is samengesteld door onderwijsbureau Bijles en Training. Wij zijn DE expert op het gebied van bijlessen en trainingen in de exacte vakken, van VMBO tot universiteit. Zowel voor individuele

Nadere informatie

AI introductie voor testers

AI introductie voor testers AI introductie voor testers De basis van deep learning TestNet werkgroep Testen met AI Martin van Helden Sander Mol Introductie Artificial Intelligence (AI) is anders dan traditioneel programmeren. Traditioneel

Nadere informatie

TW2020 Optimalisering

TW2020 Optimalisering TW2020 Optimalisering Hoorcollege 8 Leo van Iersel Technische Universiteit Delft 28 oktober 2015 Leo van Iersel (TUD) TW2020 Optimalisering 28 oktober 2015 1 / 25 Definitie Een boom is een samenhangende

Nadere informatie

Samenhang in Morfologische Beeldanalyse

Samenhang in Morfologische Beeldanalyse Samenhang in Morfologische Beeldanalyse Michael H. F. Wilkinson Instituut voor Wiskunde en Informatica Rijksuniversiteit Groningen Overzicht Wat is mathematische morfologie? Connected Filters Basis idee

Nadere informatie

Tentamen: Operationele Research 1D (4016)

Tentamen: Operationele Research 1D (4016) UITWERKINGEN Tentamen: Operationele Research 1D (4016) Tentamendatum: 12-1-2010 Duur van het tentamen: 3 uur (maximaal) Opgave 1 (15 punten) Beschouw het volgende lineaire programmeringsprobleem P: max

Nadere informatie

Statistiek = leuk + zinvol

Statistiek = leuk + zinvol Statistiek = leuk + zinvol Doel 1: Doel : Doel 3: zie titel een statistisch onderzoek kunnen beoordelen een statistisch onderzoek kunnen opzetten een probleem vertalen in standaardmethoden gegevens verzamelen,

Nadere informatie

Reeksnr.: Naam: t 2. arcsin x f(t) = 2 dx. 1 x

Reeksnr.: Naam: t 2. arcsin x f(t) = 2 dx. 1 x Calculus, 4//4. Gegeven de reële functie ft) met als voorschrift t arcsin x ft) = dx x a) Geef het domein van de functie ft). Op dit domein, bespreek waar de functie stijgt, daalt en bepaal de lokale extrema.

Nadere informatie

8. Analyseren van samenhang tussen categorische variabelen

8. Analyseren van samenhang tussen categorische variabelen 8. Analyseren van samenhang tussen categorische variabelen Er bestaat een samenhang tussen twee variabelen als de verdeling van de respons (afhankelijke) variabele verandert op het moment dat de waarde

Nadere informatie

Inleiding Programmeren 2

Inleiding Programmeren 2 Inleiding Programmeren 2 Gertjan van Noord November 26, 2018 Stof week 3 nogmaals Zelle hoofdstuk 8 en recursie Brookshear hoofdstuk 5: Algoritmes Datastructuren: tuples Een geheel andere manier om te

Nadere informatie

case: ocl-expressies

case: ocl-expressies Hoofdstuk 7 case: ocl-expressies In dit hoofdstuk worden de expressies ontwikkeld bij het domein-klassediagram van de case zoals dat in hoofdstuk 5 ontwikkeld is. Daarna worden de resterende stappen uit

Nadere informatie

MULTIPELE IMPUTATIE IN VOGELVLUCHT

MULTIPELE IMPUTATIE IN VOGELVLUCHT MULTIPELE IMPUTATIE IN VOGELVLUCHT Stef van Buuren We hebben het er liever niet over, maar allemaal worden we geplaagd door ontbrekende gegevens. Het liefst moffelen we problemen veroorzaakt door ontbrekende

Nadere informatie

Zoemzinnen. Algemene info. Functies met een variabel aantal argumenten

Zoemzinnen. Algemene info. Functies met een variabel aantal argumenten Zoemzinnen Functies met een variabel aantal argumenten Bij het definiëren van een functie leg je in principe vast hoeveel argumenten er aan de functie moeten doorgegeven worden. Dit aantal correspondeert

Nadere informatie

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 22 april 2010 1 1 Introductie De

Nadere informatie

Local search. Han Hoogeveen CGN A februari, 2009

Local search. Han Hoogeveen CGN A februari, 2009 1 Local search Han Hoogeveen CGN A312 j.a.hoogeveen@cs.uu.nl www.cs.uu.nl/docs/vakken/opt/colleges.html 4 februari, 2009 2 Inhoud vandaag In totaal vier uur Slides staan al op het web www.cs.uu.nl/docs/vakken/opt/colleges.html

Nadere informatie

Universiteit Utrecht Faculteit Wiskunde en Informatica. Examen Optimalisering op maandag 18 april 2005, uur.

Universiteit Utrecht Faculteit Wiskunde en Informatica. Examen Optimalisering op maandag 18 april 2005, uur. Universiteit Utrecht Faculteit Wiskunde en Informatica Examen Optimalisering op maandag 18 april 2005, 9.00-12.00 uur. De opgaven dienen duidelijk uitgewerkt te zijn en netjes ingeleverd te worden. Schrijf

Nadere informatie

Discrete Wiskunde 2WC15, Lente Jan Draisma

Discrete Wiskunde 2WC15, Lente Jan Draisma Discrete Wiskunde 2WC15, Lente 2010 Jan Draisma HOOFDSTUK 2 Gröbnerbases 1. Vragen We hebben gezien dat de studie van stelsels polynoomvergelijkingen in meerdere variabelen op natuurlijke manier leidt

Nadere informatie

Basiskennis lineaire algebra

Basiskennis lineaire algebra Basiskennis lineaire algebra Lineaire algebra is belangrijk als achtergrond voor lineaire programmering, omdat we het probleem kunnen tekenen in de n-dimensionale ruimte, waarbij n gelijk is aan het aantal

Nadere informatie

Samenvatting (in Dutch)

Samenvatting (in Dutch) Samenvatting (in Dutch) Geordende latente klassen modellen voor nonparametrische itemresponstheorie Een geordend latente klassen model kan als een nonparametrisch itemresponstheorie model beschouwd worden.

Nadere informatie