TEXT ANALYTICS. Gast College
|
|
- Dennis van der Pol
- 7 jaren geleden
- Aantal bezoeken:
Transcriptie
1 TEXT ANALYTICS Gast College TouW Longhow Lam -- Data
2 AGENDA Inleiding Text mining & Machine learning Ludieke voorbeelden Goede tijden Slechte tijden IENS Reviews Ajax samenvattingen Twee klant cases.
3 INLEIDING TEXT MINING EN MACHINE LEARNING
4 TEXT MINING BASIS Document 1: Ik loop over straat in Amsterdam, 1057DK, met mijn fiets Document 2: Zij liep niet maar fietste met haar blauwe fieets, //bitly.com/sdrtw Document 3: Mijn tweewieler is kapot, wat een slecht stuk ijzer, Terms Doc 1 Doc 2 Doc 3 +Fiets (znmw) Fietsen (ww) Blauwe (bvg) Amsterdam (locatie) Lopen (ww) Straat (znmw) Kapot (bijw) Slecht Stuk Ijzer DK (postcode) //bitly.com/sdrtw (Internet) TERM DOCUMENT MATRIX: A Elk document is een (zeer) lange vector van tellingen (vaak veel nullen!) Pas data mining toe op de matrix A.
5 TEXT MINING BASIS Geavanceerd woordjes tellen Parse & Filter Part of speech Entity detection Mixed / numeric / abbrev. Stemming Spell checks, Stop lijst, Synoniem lijst Multi-term woorden Pas Traditionele data mining toe Clustering Prediction / machine learning
6 TEXT MINING TERM DOCUMENT MATRIX A Het is niet handig om data mining technieken direct op de term document matrix toe te passen Often more terms than documents Rows could be strongly correlated Matrix is often very sparse Doe eerst een Singular Value decomposition.
7 TEXT MINING SVD OP DE TERM DOCUMENT MATRIX A Dit staat ook bekend als Latent Semantic Analysis (LSA) Matrix SVD decompositie: V T k A A k U k U Σ Σ k V T Diagonaal met r singular values [ kunnen er duizenden zijn ] Neem alleen de eerste k << r singular values Een document d is nu niet een vector van m woord counts maar een kortere vector d, Een punt in de 300 dimensionale ruimte!
8 SVD EXAMPLE USING MY SON AS AN EXPERIMENT Original 2448 X 3264 ~ 8 mln numbers SVD: 15 largest SV s 1% of the data SVD: 75 largest V s 5% of the data SVD: 100 largest SV s 7% of the data
9 TEXT MINING VOORSPELLEN OF CLUSTEREN Combineer teksten en gewone data om gedrag te voorspellen (churn / fraud) Pas machine learning toe om gedrag (ook wel de target) Y te voorspellen met een model f Maak automatisch topics / clusters in hoge stapels documenten Pas cluster technieken toe om documenten in clusters (topics) in te delen Topic 1 Topic 2 Topic 3
10 MACHINE LEARNING OM TE VOORSPELLEN SUPERVISED LEARNING LINEAR REGRESSIE, NEURAL NETS, TREES & FORESTS, KNN
11 MACHINE LEARNING VOORSPEL IEMANDS INKOMEN Voorspel iemand inkomen op basis van leeftijd Verzamel wat data Plot de data Analytical Base Table Income Income = Age Is dit machine learning? Ja! Y = w 0 + w 1 X 1 + w 2 X 2 + w 3 X 3 Age
12 NEURAAL NETWERK LINEAIRE REGRESSIE 1 w 0 f Y = f (X,w) = w 0 + w 1 X 1 + w 2 X 2 + w 3 X 3 X 1 w 1 X 2 w 2 X 3 w 3 Neuraal netwerk compute node f is de zgn. activatie functie. Dit is nu lineair Er zijn vier gewichten die bepaald / getraind moeten worden
13 NEURAAL NETWERK WISKUNDIGE FORMULERING In formules wordt de NN voorspeller gegeven door: P Y X) = g T Y Leeftijd X1 α 1 T Y = β 0Y + β Y T Z Inkomen X2 Z1 β 1 Z m = σ α 0m + α m T X Z2 Y De functies g en σ zijn als volgt gedefinieerd Regio X3 N Z3 g T Y = et Y e T N+e T Y, σ(x) = 1 1+e x In geval van een binaire classifier P N X = 1 P(Y X) Geslacht X4 X inputs Hidden layer z outputs De model gewichten α and β moeten getraind worden m.b.v. de data
14 NEURAAL NETWERK DE GEWICHTEN TRAINEN Back propagation algorithm Randomly choose small values for all w i s For each data point (observation) 1. Calculate the neural net prediction 2. Calculate the error E (for example: E = (actual prediction) 2 ) 3. Adjust weights w according to: w i new = w i + w i w i = α E w i 4. Stop if error E is small enough.
15 DEEP LEARNING NEURAAL NETWERK MET MEER DAN 2 HIDDEN LAYERS
16 DECISION TREES Hoe werkt het? Een simpel voorbeeld Stel we hebben de volgende groep mensen 50% Response 50% No Response We weten van deze mensen Age and Marital Status 30% 70% 50% 50% Age 45 Age> 45 60% 40% 20% 80% Married Divorced UnMarried 60% 40%
17 DECISION TREES REGRESSION & CLASSIFICATION Target X 1 X 2 X 3 X 4 X 5 Y 12 A X N 21 B X Y 32 A U Y 34 C U N 23 A U N 13 B X N 45 A X Y 46 A X Een recursief splits algoritme: 1. Loop door alle input variabelen 2. Bepaal per input hoe te splitsen 3. Neem de beste input om te splitsen 4. Op de twee nieuwe datasets pas stap 1, 2, 3 toe. 5. Stop een keer.
18 COMBINE MODELS BAGGING If one model is not good enough: let multiple models vote for a prediction Bootstrap Aggregation (Bagging) data Random sample Final model This makes only sense if underlying models are different enough and have some predictive power
19 Random Forests Bagging with trees Pas volgende stappen herhaaldelijk toe 1. Genereer een bootstrap sample 2. Kies random m inputs m << P 3. Fit een decision tree op de bootstrap sample met de m inputs In geval van een classification tree: The random forest voorspelling is de majority vote van alle trees In geval van een regression tree: The random forest voorspelling is het gemiddelde van alle trees
20 K-NEAREST NEIGHBOR METHODE Het is geen Model. Gegeven query punt x 0, vind de k punten x 1, x 2,..., x k die het dichtstbij x 0 liggen. Classificeer x 0 met majority vote van de k neighbours x 0 5 nearest neighbours van x 0 3 zijn rood 2 zijn groen Dus we voorspellen x 0 als rood
21 K-NN METHOD Gebruik verschillende waarden voor k in test errors Ondanks de simpelheid is k-nearest-neighbors succesvol ingezet voor problemen als: Recognizing handwritten digits, Analyzing satellite image scenes Discovering EKG patterns
22 K-NN EXAMPLE HUIZENPRIJZEN OP FUNDA Scrape de huisprijzen van funda.nl We hebben 108K funda huisprijzen. Hoe kunnen de huisprijs schatten van huizen (die niet op funda staan)? Neem de gemiddelde prijs van de k huisprijzen die het dichtstbij liggen
23 K-NN EXAMPLE HUIZENPRIJZEN OP FUNDA 30% van de data was gebruikt als validatie set Verschillende waarden voor k geprobeerd k = 5 had de laagste Average squared error
24
25 CLUSTER TECHNIEKEN VOOR TOPICS CREATION UNSUPERVISED LEARNING K-MEANS HIËRARCHISCH CLUSTEREN
26 K-means Hiërarchisch clusteren Kies aantal clusters: k Start met k random cluster centroids Wijs de punten toe aan een dichtstbijzijnde cluster centroid Centroids her-berekenen en itereren Elk punt is een aparte cluster Voeg punten samen die dichtbij elkaar liggen Ga zo door tot alle punten 1 cluster vormen
27 TEXT ANALYTICS VOORBEELDEN ECHTE DATA MAAR LUDIEKE VOORBEELDEN Ludieke voorbeelden met directe toepassingen Goede tijden slechte tijden Soap analytics Iens Restaurant analytics Ajax samenvattingen
28 GTST ANALYSIS TEXT ANALYTICS Business pain Kijkend naar een paar GTST afleveringen: waar gaat dit over, zijn er trends in de serie, is het niet allemaal het zelfde? Aanpak Neem alle duizenden samenvattingen en pas SAS text mining toe
29 GTST ANALYSIS RESULTATEN Hoofd topics in 5000 afleveringen
30 GTST ANALYSIS RELATIE TUSSEN TOPICS
31 GTST ANALYSIS INZOOMEND OP EEN TOPIC
32 GTST ANALYSIS INZOOMEND OP EEN TOPIC Sub-topics van een hoofd topic: topic 16 (Ludo, Isabelle, Martine, Janine) Het eenzaam voelen van Harmsen. Plan van Jack, gevaarlijk Afscheidsbrief schrijven Paniek, angst, Vragen opdracht kind geven Geld terug krijgen betalen Business validatie: De trouwe GTST kijker bij SAS kan zich hierin vinden..
33 GTST ANALYSIS RESULTATEN Trends over tijd m.b.v. een Bayesian belief netwerk
34 GTST ANALYSIS TRENDS OVER TIJD
35 GTST ANALYSE GELIJKENIS AFLEVERINGEN OVER DE JAREN
36 IENS RESTAURANT PATH ANALYTICS Business pain Ik heb Chinees gegeten. Waar moet ik de volgende keer eten? Kan ik het sentiment voorspellen? Aanpak Kijk naar wat andere doen, IENS restaurant reviewers!
37 EEN PAAR FEITJES IENS DATA (TRADITIONELE BI) Meest voorkomende naam (39 keer) Zo n 700 reviews op een normale zaterdag Valentijn reviews (1.7 keer) Duurzame keukens Biologisch (67%) Frans (58%) Vis (44%) Vegetarisch (39%) Regionaal (36%) Chinees (3%) 12 keer 23 keer Onder Hollandse restaurant (6 keer)
38 IENS RESTAURANT PATH ANALYSIS: GEGENEREERDE REGELS
39 PERSOONLIJKE RECOMMENDATIONS Amazon, BOL, Netflix, Recommendation Engines Collaborative filtering, SVD Factorizations
40 RECOMMENDATION ENGINE Users rated items (products) explicitly Matrix is often very sparse!! IENS 100,889 users 8,900 Restaurants 897,912,100 ratings possible But only 211,143 ratings given (0.02%) USER ITEM MATRIX User - Item Matrix Data User 4's Item Ratings User After some math. recommendations are: User EXPLICIT RECOMMENDATIONS Item 1 Item 2 Item 3 Item 4 Item 5 User User User User User User User User User User Recommend item 2!
41 RE METHODS K NEAREST NEIGHBORS METHOD
42 PERSOONLIJKE RESTAURANT AANBEVELING
43 Social Netwerk analysis Chinese restaurants Community Kleur Page rank Grootte
44 IENS REVIEWS ANALYTICS OP DE REVIEWS ZELF Parse and filter reviews met SAS text miner Transformeer reviews naar data punten in SVD space.
45 IENS REVIEWS TOPICS Genereer enkele topics met SAS Text miner Sfeer, heerlijke avond gezellig, mooie locatie Wijn, glas, water Lang wachten Pittig, kip, Thais Bediening, personeel
46 IENS REVIEWS HET EET CIJFER VOORSPELLEN Neural (2 X 20) R 2 van 0.65 Linear reg model R 2 van 0.56
47 IENS REVIEWS HET EET CIJFER VOORSPELLEN Predicted review score vs. Given review score
48 IENS REVIEWS SENTIMENT ANALYSE / PREDICTIVE MODELING
49 AJAX VOETBAL VERSLAGEN Business pain Ik kan niet mee praten op mijn werk over voetbal Kan ik wat tips meegeven aan ons SAS NL voetbal team? Aanpak Text mine alle Ajax voetbal verslagen en leer wat interessante resultaten uit je hoofd. Er zijn 476 voetbal verslagen. Ik heb gescraped van seizoen 2000/01 tot 2014/15.
50 AJAX CONCEPT LINKING VOETBAL TIPS EN STOF OM OVER MEE TE PRATEN Het verdedigingstrio van der Wiel, Vertongen, Anita Wie herinnert zich niet de mooie passes van Aldewereld naar Boerrigter Zorg niet voor veel balverlies, is een domper zorgt voor onrust en leidt niet tot een overwinning Chivu, Machlas en Heitinga worden vaak geassocieerd met overtredingen De Jong en Chivu worden vaak met verlies geassocieerd. Knullig spelen levert ook grote kans op verlies.. Score binnen 23 minuten! Leidt vaak tot winst
51 WERKT HET? SAS NEDERLAND VOETBAL TEAM In september 6e geworden i.p.v. altijd laatste!!!!
52 TWEE USE CASES BIJ BEDRIJVEN
53 TEXT ANALYTICS OPERATIONAL RISK ANALYSIS DUTCH BANK 100 s of complaints per month (web, ,..) Identify issues related to financial risks, and causing reputation damage, like: Fraudulous collections Problems with refinancing mortgages Insight in claim risks based on customer complaints Results: More efficient and faster complaint handling
54 TEXT ANALYTICS IDENTIFY EMERGING RISKS ON FOOD AND PRODUCT SAFETY DUTCH FOOD AND CONSUMER PRODUCT SAFETY AUTHORITY Use cases: Identify potential high-risk companies based on customer reviews (e.g. restaurant reviews on web) Identify product failures based on customer complaints Optimize resources for inspection of companies
55 SAMENVATTEND teksten analyseren met text mining en machine learning is makkelijk te doen. Snel inzichten uit teksten te halen Business validatie nodig en belangrijk! Dit is ludiek! Maar talrijke serieuze toepassingen
TEXT ANALYTICS 11/22/2015. Inleiding Text mining & Machine learning Ludieke voorbeelden. Twee klant cases. AGENDA
11/22/2015 TEXT ANALYTICS Gast College TouW Longhow Lam -- Data Scientist @longhowlam https://longhowlam.wordpress.com/ https://www.linkedin.com/today/author/7434679 Cop yrig ht 2012, SAS Institute Inc.
Nadere informatieNeurale Netwerken en Deep Learning. Tijmen Blankevoort
Neurale Netwerken en Deep Learning Tijmen Blankevoort De toekomst - Internet of Things De toekomst - sluiertipje Je gezondheid wordt continue gemonitored Je dieet wordt voor je afgestemd -> Stroomversnelling
Nadere informatieAI introductie voor testers
AI introductie voor testers De basis van deep learning TestNet werkgroep Testen met AI Martin van Helden Sander Mol Introductie Artificial Intelligence (AI) is anders dan traditioneel programmeren. Traditioneel
Nadere informatieClassification - Prediction
Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training
Nadere informatieData Mining: Classificatie
Data Mining: Classificatie docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Overzicht Wat is classificatie? Leren van een beslissingsboom. Problemen
Nadere informatieLDA Topic Modeling. Informa5ekunde als hulpwetenschap. 9 maart 2015
LDA Topic Modeling Informa5ekunde als hulpwetenschap 9 maart 2015 LDA Voor de pauze: Wat is LDA? Wat kan je er mee? Hoe werkt het (Gibbs sampling)? Na de pauze Achterliggende concepten à Dirichlet distribu5e
Nadere informatieTentamen Data Mining
Tentamen Data Mining Algemene Opmerkingen Dit is geen open boek tentamen, noch mogen er aantekeningen gebruikt worden. Laat bij het uitvoeren van berekeningen zien hoe je aan een antwoord gekomen bent.
Nadere informatieAssessing writing through objectively scored tests: a study on validity. Hiske Feenstra Cito, The Netherlands
Assessing writing through objectively scored tests: a study on validity Hiske Feenstra Cito, The Netherlands Outline Research project Objective writing tests Evaluation of objective writing tests Research
Nadere informatiez x 1 x 2 x 3 x 4 s 1 s 2 s 3 rij rij rij rij
ENGLISH VERSION SEE PAGE 3 Tentamen Lineaire Optimalisering, 0 januari 0, tijdsduur 3 uur. Het gebruik van een eenvoudige rekenmachine is toegestaan. Geef bij elk antwoord een duidelijke toelichting. Als
Nadere informatieQuestion-Driven Sentence Fusion is a Well-Defined Task. But the Real Issue is: Does it matter?
Question-Driven Sentence Fusion is a Well-Defined Task. But the Real Issue is: Does it matter? Emiel Krahmer, Erwin Marsi & Paul van Pelt Site visit, Tilburg, November 8, 2007 Plan 1. Introduction: A short
Nadere informatieINZET VAN MACHINE LEARNING
INZET VAN MACHINE LEARNING VOORSTELLEN INHOUD Context wat is de staat van de verzekeringsindustrie? Machine Learning - wat is het eigenlijk en is het nieuw? Toepassingen waar wordt ML met succes toegepast?
Nadere informatieMACHINE LEARNING. Een egocentrische presentatie door een data scientist van Axians. Michel van Gelder Data Scientist bij Axians
MACHINE LEARNING Een egocentrische presentatie door een data scientist van Axians Michel van Gelder Data Scientist bij Axians 1 MICHEL VAN GELDER Data Scientist Axians 2 A day in the life of.. 3 MACHINE
Nadere informatieBusiness Analytics bij. Zilveren Kruis. Rob Konijn Data Scientist Kenniscentrum. 12 mei 2016
Business Analytics bij Zilveren Kruis Rob Konijn Data Scientist Kenniscentrum Zilveren Kruis 12 mei 2016 Introductie Rob Konijn - Business Analytics (toen nog BWI) 2002-2008 - Phd VU (Wojtek Kowalczyk/Bert
Nadere informatieLiving Labs : NFI & RvdK Samen onderweg naar meer grip op data. JenV I-tour presentatie 24 april 2018
Living Labs : NFI & RvdK Samen onderweg naar meer grip op data JenV I-tour presentatie 24 april 2018 1 Agenda Deel I - door Jannie RvdK Intermezzo filmpje I-plan JenV Deel II door Femke en Xandra NFI KInD
Nadere informatieArtificial Intelligence in uw dagelijkse praktijk. Hilversum, 22 September 2016
Artificial Intelligence in uw dagelijkse praktijk Hilversum, 22 September 2016 Agenda 09:30 Welkom en introductie 09:35 Artificial Intelligence, al meer dan 50 jaar een actief onderzoeksgebied Jaap van
Nadere informatieContentSearch. Deep dive
ContentSearch Deep dive 2 Waarvoor in te zetten? Alternatief voor database queries Waar performance een issue kan zijn Daadwerkelijk frontend Site Search Mogelijk niet de beste optie maar wel goedkoop
Nadere informatieOPEN TRAINING. Onderhandelingen met leveranciers voor aankopers. Zeker stellen dat je goed voorbereid aan de onderhandelingstafel komt.
OPEN TRAINING Onderhandelingen met leveranciers voor aankopers Zeker stellen dat je goed voorbereid aan de onderhandelingstafel komt. Philip Meyers Making sure to come well prepared at the negotiation
Nadere informatieDATA MINING (TI2730-C)
Technische Universiteit Delft Elektrotechniek, Wiskunde en Informatica Secties: Pattern Recognition & Bioinformatics & Multimedia Signal Processing DATA MINING (TI2730-C) Schriftelijk (her)tentomen. Dinsdag
Nadere informatieArtificial Intelligence
Artificial Intelligence De kansen, risico s en ethische dilemma s van machine learning Casper Rutjes Sophie Smits Viviënne Haring 25 jaar geleden Neural networks are revolutionizing virtually every aspect
Nadere informatieData fusion & Geo-psychographical database
Data fusion & Geo-psychographical database Pascal van Hattum University Utrecht Differentiated marketing Target customers as individually as possible Sell the same product or service, but change the marketing
Nadere informatieHet gebruik van data binnen Tax PwC Eric Dankaart November 2016
www.pwc.nl Eric Dankaart November 2016 Agenda Digitalisering en de data explosie Waarom is data voor Tax interessant? 1. Meer data, meer data-analyse 2. Invloed op wet- en regelgeving 3. Wat betekent dit
Nadere informatieCOGNITIEVE DISSONANTIE EN ROKERS COGNITIVE DISSONANCE AND SMOKERS
COGNITIEVE DISSONANTIE EN ROKERS Gezondheidsgedrag als compensatie voor de schadelijke gevolgen van roken COGNITIVE DISSONANCE AND SMOKERS Health behaviour as compensation for the harmful effects of smoking
Nadere informatieMachine Learning voor een persoonlijker Blendle. Martijn Spitters
Machine Learning voor een persoonlijker Blendle Martijn Spitters Blendle In het kort Missie Je helpen s werelds beste journalistiek te ontdekken en te steunen Microbetaalplatform artikelen, issues, abonnementen
Nadere informatieIntroductie in flowcharts
Introductie in flowcharts Flow Charts Een flow chart kan gebruikt worden om: Processen definieren en analyseren. Een beeld vormen van een proces voor analyse, discussie of communicatie. Het definieren,
Nadere informatieCORPORATE BRANDING AND SOCIAL MEDIA: KEY FINDINGS FOR DUTCH CONSUMERS Theo Araujo
CORPORATE BRANDING AND SOCIAL MEDIA: KEY FINDINGS FOR DUTCH CONSUMERS Theo Araujo BEOORDEEL DEZE LEZING VIA DE MIE2018 APP! Geef direct na deze lezing jouw beoordeling. Zoek de lezing op via Programma
Nadere informatieIr. Herman Dijk Ministry of Transport, Public Works and Water Management
Policy Aspects of Storm Surge Warning Systems Ir. Herman Dijk Ministry of Transport, Public Works and Water Contents Water in the Netherlands What kind of information and models do we need? Flood System
Nadere informatieSAMPLE 11 = + 11 = + + Exploring Combinations of Ten + + = = + + = + = = + = = 11. Step Up. Step Ahead
7.1 Exploring Combinations of Ten Look at these cubes. 2. Color some of the cubes to make three parts. Then write a matching sentence. 10 What addition sentence matches the picture? How else could you
Nadere informatieProcess Mining and audit support within financial services. KPMG IT Advisory 18 June 2014
Process Mining and audit support within financial services KPMG IT Advisory 18 June 2014 Agenda INTRODUCTION APPROACH 3 CASE STUDIES LEASONS LEARNED 1 APPROACH Process Mining Approach Five step program
Nadere informatie! GeoNetwork INSPIRE Atom!
GeoNetwork INSPIRE Atom GeoNetwork INSPIRE Atom 1 Configuration 2 Metadata editor 3 Services 3 Page 1 of 7 Configuration To configure the INSPIRE Atom go to Administration > System configuration and enable
Nadere informatieRisk & Requirements Based Testing
Risk & Requirements Based Testing Tycho Schmidt PreSales Consultant, HP 2006 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice Agenda Introductie
Nadere informatiePilot vragenlijst communicatieve redzaamheid
Pilot vragenlijst communicatieve redzaamheid Het instrument Communicatieve redzaamheid kan worden opgevat als een vermogen om wederkerig te communiceren met behulp van woorden, gebaren of symbolen. Communicatief
Nadere informatieL.Net s88sd16-n aansluitingen en programmering.
De L.Net s88sd16-n wordt via één van de L.Net aansluitingen aangesloten op de LocoNet aansluiting van de centrale, bij een Intellibox of Twin-Center is dat de LocoNet-T aansluiting. L.Net s88sd16-n aansluitingen
Nadere informatieMyDHL+ Van Non-Corporate naar Corporate
MyDHL+ Van Non-Corporate naar Corporate Van Non-Corporate naar Corporate In MyDHL+ is het mogelijk om meerdere gebruikers aan uw set-up toe te voegen. Wanneer er bijvoorbeeld meerdere collega s van dezelfde
Nadere informatieL.Net s88sd16-n aansluitingen en programmering.
De L.Net s88sd16-n wordt via één van de L.Net aansluitingen aangesloten op de LocoNet aansluiting van de centrale, bij een Intellibox of Twin-Center is dat de LocoNet-T aansluiting. L.Net s88sd16-n aansluitingen
Nadere informatieFOR DUTCH STUDENTS! ENGLISH VERSION NEXT PAGE
FOR DUTCH STUDENTS! ENGLISH VERSION NEXT PAGE Tentamen Analyse 6 januari 203, duur 3 uur. Voeg aan het antwoord van een opgave altijd het bewijs, de berekening of de argumentatie toe. Als je een onderdeel
Nadere informatieFOR DUTCH STUDENTS! ENGLISH VERSION NEXT PAGE. Toets Inleiding Kansrekening 1 8 februari 2010
FOR DUTCH STUDENTS! ENGLISH VERSION NEXT PAGE Toets Inleiding Kansrekening 1 8 februari 2010 Voeg aan het antwoord van een opgave altijd het bewijs, de berekening of de argumentatie toe. Als je een onderdeel
Nadere informatieAI en Software Testing op de lange termijn
AI en Software Testing op de lange termijn Is het een appel? Traditioneel programmeren AI Kleur = rood, groen, geel Vorm = rond Textuur = glad Artificial Intelligence Machine Learning Methods Technologies
Nadere informatieTYPE EXAMENVRAGEN VOOR TOEGEPASTE STATISTIEK
TYPE EXAMENVRAGEN VOOR TOEGEPASTE STATISTIEK Prof. Dr. M. Vandebroek 1. Een aantal proefpersonen werd gevraagd een frisdrank te beoordelen door aan te geven in hoeverre ze het eens zijn met de volgende
Nadere informatieTentamen Data Mining. Algemene Opmerkingen. Opgave L. Korte vragen (L6 punten) Tijd: 14:00-17:00. Datum: 4januai20l6
Tentamen Data Mining Datum: 4januai2l6 Tijd: 4: - 7: Algemene Opmerkingen e Dit is geen open boek tentamen, noch mogen er aantekeningen gebruikt worden. o Laat bij het uitvoeren van berekeningen zien hoeje
Nadere informatieGeneral info on using shopping carts with Ingenico epayments
Inhoudsopgave 1. Disclaimer 2. What is a PSPID? 3. What is an API user? How is it different from other users? 4. What is an operation code? And should I choose "Authorisation" or "Sale"? 5. What is an
Nadere informatieInteraction Design for the Semantic Web
Interaction Design for the Semantic Web Lynda Hardman http://www.cwi.nl/~lynda/courses/usi08/ CWI, Semantic Media Interfaces Presentation of Google results: text 2 1 Presentation of Google results: image
Nadere informatieRetail analytics. Business Intelligence Cloud Services
Retail analytics Business Intelligence Cloud Services Retail Analytics De juiste informatie op het juiste tijdstip Insights Krijg antwoorden! Tegenwoordig worden Retail organisaties geconfronteerd met
Nadere informatievan Werknemers Well-being Drs. P.E. Gouw
De Invloed van Werk- en Persoonskenmerken op het Welbevinden van Werknemers The Influence of Job and Personality Characteristics on Employee Well-being Drs. P.E. Gouw Eerste begeleider: Dr. S. van Hooren
Nadere informatieData mining Van boodschappenmandjes tot bio-informatica
Data mining Van boodschappenmandjes tot bio-informatica Walter Kosters Informatica, Universiteit Leiden donderdag 6 april 2006 http://www.liacs.nl/home/kosters/ 1 Wat is Data mining? Data mining probeert
Nadere informatieIssues in PET Drug Manufacturing Steve Zigler PETNET Solutions April 14, 2010
Issues in PET Drug Manufacturing Steve Zigler PETNET Solutions April 14, 2010 Topics ANDA process for FDG User fees Contract manufacturing PETNET's perspective Colleagues Michael Nazerias Ken Breslow Ed
Nadere informatieKNVB & SAS MAARTEN HOFFER - KNVB RENE VAN DER LAAN - SAS
KNVB & SAS MAARTEN HOFFER - KNVB RENE VAN DER LAAN - SAS KNVB - MAARTEN HOFFER HET NL VOETBALLANDSCHAP VOETBAL OM VAN TE HOUDEN HET NL VOETBALLANDSCHAP 1.227.157 leden 1.077.078 man 146.090 vrouw 16.968.133
Nadere informatieURBAN SCIENCE. Professor Nanda Piersma Michael Hogenboom
URBAN SCIENCE Professor Nanda Piersma Michael Hogenboom Nanda Piersma Hogeschool van Amsterdam (HvA) Centrum Wiskunde & Informatica (CWI) URBAN TECHNOLOGY SOLUTIONS FOR SUSTAINABLE, LIVEABLE AND CONNECTED
Nadere informatieHet gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.
Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen. 1. (a) In de appendix van deze vraag, is een dataset gegeven met de corresponderende
Nadere informatieHet Verband Tussen Persoonlijkheid, Stress en Coping. The Relation Between Personality, Stress and Coping
Het Verband Tussen Persoonlijkheid, Stress en Coping The Relation Between Personality, Stress and Coping J.R.M. de Vos Oktober 2009 1e begeleider: Mw. Dr. T. Houtmans 2e begeleider: Mw. Dr. K. Proost Faculteit
Nadere informatieData Mining: Classificatie
Data Mining: lassificatie docent: dr. Toon alders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Vorige les lassificatie: Het groeperen van objecten in voorgedefinieerde
Nadere informatieANGSTSTOORNISSEN EN HYPOCHONDRIE: DIAGNOSTIEK EN BEHANDELING (DUTCH EDITION) FROM BOHN STAFLEU VAN LOGHUM
Read Online and Download Ebook ANGSTSTOORNISSEN EN HYPOCHONDRIE: DIAGNOSTIEK EN BEHANDELING (DUTCH EDITION) FROM BOHN STAFLEU VAN LOGHUM DOWNLOAD EBOOK : ANGSTSTOORNISSEN EN HYPOCHONDRIE: DIAGNOSTIEK STAFLEU
Nadere informatieRECEPTEERKUNDE: PRODUCTZORG EN BEREIDING VAN GENEESMIDDELEN (DUTCH EDITION) FROM BOHN STAFLEU VAN LOGHUM
Read Online and Download Ebook RECEPTEERKUNDE: PRODUCTZORG EN BEREIDING VAN GENEESMIDDELEN (DUTCH EDITION) FROM BOHN STAFLEU VAN LOGHUM DOWNLOAD EBOOK : RECEPTEERKUNDE: PRODUCTZORG EN BEREIDING VAN STAFLEU
Nadere informatieSocio-economic situation of long-term flexworkers
Socio-economic situation of long-term flexworkers CBS Microdatagebruikersmiddag The Hague, 16 May 2013 Siemen van der Werff www.seo.nl - secretariaat@seo.nl - +31 20 525 1630 Discussion topics and conclusions
Nadere informatieVertrouwen en verbinden. R Huizinga en J Ciocoiu KPN Consulting
Vertrouwen en verbinden R Huizinga en J Ciocoiu KPN Consulting Data: driver voor digitale transformatie Digitalisering aanjager van data management. Data management is aanjager van digitalisering. Van
Nadere informatieWaarmaken van Leibniz s droom
Waarmaken van Leibniz s droom Artificiële intelligentie Communicatie & internet Operating system Economie Computatietheorie & Software Efficiënt productieproces Hardware architectuur Electronica: relais
Nadere informatieCommunication about Animal Welfare in Danish Agricultural Education
Communication about Animal Welfare in Danish Agricultural Education Inger Anneberg, anthropologist, post doc, Aarhus University, Department of Animal Science Jesper Lassen, sociologist, professor, University
Nadere informatieLaboratory report. Independent testing of material surfaces. Analysis of leaching substances in treated wood samples conform guide line EU 10/2011
Independent testing of material surfaces Laboratory report Analysis of leaching substances in treated wood samples conform guide line EU 10/2011 Customer Wasziederij De Vesting BV Trasweg 12 5712 BB Someren-Eind
Nadere informatieRisico s van Technologisch Succes in digitale transformatie S T R A T E G I C A D V I S O R
Risico s van Technologisch Succes in digitale transformatie 2e Risk Event 2019 11 april 2019 The S T R A T E G I C A D V I S O R Ymanagement school of the autonomous University of Antwerp 2 Prof. dr. Hans
Nadere informatie(Big) Data in het sociaal domein
(Big) Data in het sociaal domein Congres Sociaal: sturen op gemeentelijke ambities 03-11-2016 Even voorstellen Laudy Konings Lkonings@deloitte.nl 06 1100 3917 Romain Dohmen rdohmen@deloitte.nl 06 2078
Nadere informatie2. Geef een voorbeeld van hoe datamining gebruikt kan worden om frauduleuze geldtransacties te identificeren.
1. Veronderstel dat je als datamining consultant werkt voor een Internet Search Engine bedrijf. Beschrijf hoe datamining het bedrijf kan helpen door voorbeelden te geven van specifieke toepassingen van
Nadere informatieFolkert van der Ploeg Head of Analytics & Pricing Aegon NL. Lisa Vermunt - onderzoeker Alzheimer Centrum, Amsterdam UMC
Folkert van der Ploeg Head of Analytics & Pricing Aegon NL Lisa Vermunt - onderzoeker Alzheimer Centrum, Amsterdam UMC 2 Artificial Intelligence Robotics Wearable Technology Gamification Facebook Google
Nadere informatieData driven. Het plan naar data driven business door advanced analytics Business.
Data driven. Het plan naar data driven business door advanced analytics Business. Analytics: uw data slim gebruiken en zo uw business optimaliseren! Marijn Uilenbroek BIA Consultant, Sogeti BI & Analytics
Nadere informatiei(i + 1) = xy + y = x + 1, y(1) = 2.
Kenmerk : Leibniz/toetsen/Re-Exam-Math A + B-45 Course : Mathematics A + B (Leibniz) Date : November 7, 204 Time : 45 645 hrs Motivate all your answers The use of electronic devices is not allowed [4 pt]
Nadere informatieLichamelijke factoren als voorspeller voor psychisch. en lichamelijk herstel bij anorexia nervosa. Physical factors as predictors of psychological and
Lichamelijke factoren als voorspeller voor psychisch en lichamelijk herstel bij anorexia nervosa Physical factors as predictors of psychological and physical recovery of anorexia nervosa Liesbeth Libbers
Nadere informatieContinuous Requirements Engineering
Continuous Requirements Engineering voor testers 1 Requirements? Dit ga ik maken Dit wil ik hebben Dit wilde de klant hebben en moest de bouwer maken 2 Het goeie ouwe V-model wensen systeem systeemrequirements
Nadere informatieHow will be the journey from corrective maintenance to preventive or even predictive maintenance?
How will be the journey from corrective maintenance to preventive or even predictive maintenance? Corporate movie Bakker Repair.mp4 Ton Klinkenberg Managing Director ton.klinkenberg@bakker-repair.nl Introduction
Nadere informatieFigure 1 Shares of Students in Basic, Middle, and Academic Track of Secondary School Academic Track Middle Track Basic Track 29 Figure 2 Number of Years Spent in School by Basic Track Students 9.5 Length
Nadere informatieNovember December 2011. Jan Meskens / Onderzoek
Jan Meskens / Onderzoek 1 Wat is "Predictive Analytics"? Historische en/of huidige data Voorspellingen over de toekomst 2 Toepassing: fraudebestrijding Opsporen fraude met aanrijdingsformulieren [SAS]
Nadere informatieMISSING DATA van gatenkaas naar valide uitkomsten
MISSING DATA van gatenkaas naar valide uitkomsten Sander M.J. van Kuijk Afdeling Klinische Epidemiologie en Medical Technology Assessment sander.van.kuijk@mumc.nl Inhoud Masterclass Theorie over missing
Nadere informatieDe relatie tussen intimiteit, aspecten van seksualiteit en hechtingsstijl in het dagelijks leven van heteroseksuele mannen en vrouwen.
De relatie tussen intimiteit, aspecten van seksualiteit en hechtingsstijl in het dagelijks leven van heteroseksuele mannen en vrouwen. The Relationship between Intimacy, Aspects of Sexuality and Attachment
Nadere informatieTentamen Kunstmatige Intelligentie (INFOB2KI)
Tentamen Kunstmatige Intelligentie (INFOB2KI) 30 januari 2014 10:30-12:30 Vooraf Mobiele telefoons dienen uitgeschakeld te zijn. Het tentamen bestaat uit 7 opgaven; in totaal kunnen er 100 punten behaald
Nadere informatieTestNet voorjaarsevent 15 mei Testen met AI. Op weg naar een zelflerende testrobot. TestNet werkgroep Testen met AI. Sander Mol Marco Verhoeven
TestNet voorjaarsevent 15 mei 2018 Testen met AI Op weg naar een zelflerende testrobot TestNet werkgroep Testen met AI Sander Mol Marco Verhoeven De aanleiding: AI tool speelt breakout Tool ziet alleen
Nadere informatieData Handling Ron van Lammeren - Wageningen UR
Data Handling 1 2010-2011 Ron van Lammeren - Wageningen UR Can I answer my scientific questions? Geo-data cycle Data handling / introduction classes of data handling data action models (ISAC) Queries (data
Nadere informatieUpdate on Dutch Longevity and Longevity in Het Nieuwe Pensioenstel
Update on Dutch Longevity and Longevity in Het Nieuwe Pensioenstel André de Vries VP, Business Development, Global Financial Solutions, EMEA De Actuarisdag 2017 - Zeist - September 26, 2017 Reinsurance
Nadere informatieKunnen we natuur in woonstraten beter d'r werk laten doen?
- de groene, gezonde wijk Kunnen we natuur in woonstraten beter d'r werk laten doen? Funded by Docent NHTV Breda Onderzoeker TU Eindhoven Verloedering of Gewildgroei? Relevantie Groen in de stad focus
Nadere informatieMACHINE LEREN VOOR E-DISCOVERY
MACHINE LEREN VOOR E-DISCOVERY Hans Henseler Lector E-Discovery, HvA Symposium E-Discovery Robotisering van Informatiemanagement 21 april 2016, Congrescentrum van de Gemeente Amsterdam 1 KENNISKRING E-DISCOVERY
Nadere informatieClassification of triangles
Classification of triangles A triangle is a geometrical shape that is formed when 3 non-collinear points are joined. The joining line segments are the sides of the triangle. The angles in between the sides
Nadere informatieUniversity of Groningen
University of Groningen Jongeren in de jeugdzorg en risicofactoren van zwerfgedrag. Een onderzoek naar de bijdrage van risicofactoren van zwerfgedrag op de duur van zorggebruik bij jongeren in de jeugdzorg.
Nadere informatieSurveys: drowning in data?
Surveys: drowning in data? De toekomst van surveyonderzoek Roeland Beerten Hoofdstatisticus Vlaamse overheid Inhoud Context Surveys in een wereld vol met data De toekomst? People in this country have
Nadere informatieNever trust a bunny. D. J. Bernstein University of Illinois at Chicago. Tanja Lange Technische Universiteit Eindhoven
Never trust a bunny D. J. Bernstein University of Illinois at Chicago Tanja Lange Technische Universiteit Eindhoven The HB(n; ; 0 ) protocol (2001 Hopper Blum) Secret s 2 F n 2. Reader sends random C 2
Nadere informatieOutline A PERMANENT PASTURE LAYER BASED ON OPEN DATA 11/24/2014. The creation and monitoring of a permanent pasture layer
A PERMANENT PASTURE LAYER BASED ON OPEN DATA The creation and monitoring of a permanent pasture layer 20 th of November 2014, Marcel Meijer Outline Open Data in the Netherland Greening elements Calculating
Nadere informatieSlim Onderhoud Voorkomen lekkages en onnodige kosten. Seminar Datagestuurd Woningonderhoud
Slim Onderhoud Voorkomen lekkages en onnodige kosten Seminar Datagestuurd Woningonderhoud Ralf Putter Business Consultant John Ciocoiu Technisch Consultant Data & Analytics Slim Onderhoud Value case Project
Nadere informatieOplossingen Datamining 2II15 Juni 2008
Oplossingen Datamining II1 Juni 008 1. (Associatieregels) (a) Zijn de volgende beweringen juist of fout? Geef een korte verklaring voor alle juiste beweringen en een tegenvoorbeeld voor alle foute be-weringen:
Nadere informatieHartpatiënten Stoppen met Roken De invloed van eigen effectiviteit, actieplannen en coping plannen op het stoppen met roken
1 Hartpatiënten Stoppen met Roken De invloed van eigen effectiviteit, actieplannen en coping plannen op het stoppen met roken Smoking Cessation in Cardiac Patients Esther Kers-Cappon Begeleiding door:
Nadere informatieSHICO: SHIFTING CONCEPTS OVER TIME
SHICO: SHIFTING CONCEPTS OVER TIME Tracing Concepts in Dutch Newspaper Discourse using Sequential Word Vector Spaces Melvin Wevers Translantis Project Digital Humanities Approaches to Reference Cultures:
Nadere informatieLists of words from the books, and feedback from the sessions, are on
Vocabulairetrainer www.quizlet.com - handleiding 1. Woordenlijsten van de boeken en de feedback van de les staan op http://www.quizlet.com. Lists of words from the books, and feedback from the sessions,
Nadere informatieTentamen Biostatistiek 3 / Biomedische wiskunde
Tentamen Biostatistiek 3 / Biomedische wiskunde 25 maart 2014; 12:00-14:00 NB. Geef een duidelijke toelichting bij de antwoorden. Na correctie liggen de tentamens ter inzage bij het onderwijsbureau. Het
Nadere informatieDe combinatie van verrijkingen, machine learning en crowd sourcing
Verbetering vindbaarheid en bruikbaarheid van de digitale content van de KB De combinatie van verrijkingen, machine learning en crowd sourcing Theo van Veen, 31-1-2017 Theo van Veen, 31-1-2017 Verrijken:
Nadere informatie- MTSS - score, English language version (cross-culturally translated)
Supplementary online Material - MTSS - score, Dutch language version (validated) - MTSS - score, English language version (cross-culturally translated) Mediaal Tibiaal Stress Syndroom Score Naam: Datum:
Nadere informatieRelationele Databases 2002/2003
1 Relationele Databases 2002/2003 Hoorcollege 3 24 april 2003 Jaap Kamps & Maarten de Rijke April Juli 2003 Plan voor Vandaag Praktische dingen 2.1, 2.3, 2.6 (alleen voor 2.2 en 2.3), 2.9, 2.10, 2.11,
Nadere informatieAlle opgaven tellen even zwaar, 10 punten per opgave.
WAT IS WISKUNDE (English version on the other side) Maandag 5 november 2012, 13.30 1.30 uur Gebruik voor iedere opgave een apart vel. Schrijf je naam en studentnummer op elk vel. Alle opgaven tellen even
Nadere informatieEnkele klanten. Copyright 2012 IP Bank BV
CGE Risk Management Solutions B.V. 1 Methods & Training Research Building concepts 2 Software Standard tools Industry leading 3 4 Development Projects Capturing industry expertise Partners Training Consultancy
Nadere informatie8+ 60 MIN Alleen te spelen in combinatie met het RIFUGIO basisspel. Only to be played in combination with the RIFUGIO basicgame.
8+ 60 MIN. 2-5 Alleen te spelen in combinatie met het RIFUGIO basisspel. Only to be played in combination with the RIFUGIO basicgame. HELICOPTER SPEL VOORBEREIDING: Doe alles precies hetzelfde als bij
Nadere informatieIntroduction Henk Schwietert
Introduction Henk Schwietert Evalan develops, markets and sells services that use remote monitoring and telemetry solutions. Our Company Evalan develops hard- and software to support these services: mobile
Nadere informatieVerschillen tussen Allochtone- en Autochtone Jonge Studerende Moeders in het Ervaren van Dagelijkse Stress en het Effect ervan op de Stemming
Verschillen tussen Allochtone- en Autochtone Jonge Studerende Moeders in het Ervaren van Dagelijkse Stress en het Effect ervan op de Stemming Differences between Immigrant and Native Young Student Mothers
Nadere informatieHelp je Power BI Analytics project om zeep 6 succesfactoren. Marc Wijnberg Gebruikersdag 2018
Help je Power BI Analytics project om zeep 6 succesfactoren Marc Wijnberg Gebruikersdag 2018 20+ jaren ervaring in Business Intelligence BI & Analytics Projectendokter Trainer en Partner Sorsebridge Agile
Nadere informatieRecommender Systems voor het realtime aanbieden van nieuwssecties. Thomas Janssen
Recommender Systems voor het realtime aanbieden van nieuwssecties Thomas Janssen 23 januari 2007 1 Voorwoord Deze scriptie is geschreven ter afsluiting van mijn Bachelor voor de studie Informatica aan
Nadere informatieDe Digitale Transformatie en de impact op IT. Capgemini Edwin Leinse
De Digitale Transformatie en de impact op IT Capgemini Edwin Leinse 40+ countries and 120+ nationalities (As of December 31, 2015) North America 16 034 Latin America 9 363 Europe 62 301 Middle-East & Africa
Nadere informatieSatellite Orbit Determination with the Global Educational Network for Satellite Operations
Satellite Orbit Determination with the Global Educational Network for Satellite Operations Het project in het kort en de opgedane ervaringen Open Universiteit Nederland Faculteit Computer Science TouW
Nadere informatieNORMEN VOOR EDEPOTS DUURZAME BEWARING IS VOOR EDEPOTS GROEIMODEL NAAR EEN OAIS BLUE BOOK. Archiverings- en raadplegingsformaten
DUURZAME BEWARING IS Organisatiestructuur Resources Opslagsystemen Standaarden Archiverings- en raadplegingsformaten Karakteriseren en valideren Checksums Migreren en normaliseren Preservation metadata
Nadere informatie