Entry Point Retrieval
|
|
- Joris van de Velden
- 5 jaren geleden
- Aantal bezoeken:
Transcriptie
1 Entry Point Retrieval 1 Entry Point Retrieval Meteen naar de juiste plek. Zoeken, vinden en ranken van semi-gestructureerde data Maarten Marx ILPS, Informatica, Universiteit van Amsterdam November 2008
2 Entry Point Retrieval 2 Overzicht praatje 1. Entry Point Retrieval en XML 2. 2 Voorbeelden Zoeken in lezingen op video Zoeken in de Handelingen der Staten Generaal 3. Conclusies.
3 Entry Point Retrieval 3 ILPS groep: wie zijn dat? Prof Dr Maarten de Rijke. Leerstoel Intelligente Informatie Ontsluiting, Informatica, UvA. Dr Maarten Marx UD, Informatica, UvA.... en meer dan 20 aio s, postdocs en programmeurs
4 Entry Point Retrieval 4 Wat doen we? Intelligente Informatie Ontsluiting
5 Entry Point Retrieval 5 Sleutelwoorden Ophalen van informatie Tekst-extractie en verrijking Semantische annotatie Web 2.0 en Semantic Web MultiMedia XML
6 Entry Point Retrieval 6 Entry Point Retrieval: Wat is dat? de manier van zoeken waarbij de zoekmachine niet alleen een geordende lijst resultaten aflevert,... maar binnen elk resultaat ook nog suggesties doet om daar met lezen te beginnen. Die suggesties worden entry points genoemd.
7 Entry Point Retrieval 7 Entry Point Retrieval: Use-cases? Deze extra functionaliteit is vooral handig bij moelijk doorzoekbare documenten programmeercode, video, audio en hele lange (saaie) documenten die erg veel onderwerpen behandelen notulen, jaarverslagen, leer- en hand-boeken
8 Entry Point Retrieval 8 Entry Point Retrieval: Waarom moeilijk? 1. je kan geen ankers plaatsen in andermans documenten 2. documenten zinvol opdelen is erg moeilijk om automatisch goed en mooi te doen
9 Entry Point Retrieval 9 Entry Point Retrieval met XML XML lost beide problemen op: elk element is uniek bepaald en het document is al opgedeeld. Uitgangspunt van INEX workshops (sinds 2002). Sterke content and structure vraagtaal: NEXI geef me paragrafen over XML in artikelen met een abstract over biotechnologie
10 Entry Point Retrieval 10 Query formeel //article[about(.//abstract, biotechnologie )]// par[about(., XML )] geef me paragrafen over XML in artikelen met een abstract over biotechnologie
11 Entry Point Retrieval 11 Entry Point Retrieval: voorbeelden Voorbeelden van INEX IEEE tijdschriften Lonely Planet boeken Wikipedia Voorbeelden dit praatje Zoeken in lezingen op video Zoeken in de Handelingen der Staten Generaal
12 Entry Point Retrieval 12 Zoeken in lezingen op video Use case Groot aantal CS lezingen met slides over diverse onderwerpen Entry points Nieuwe slide Zoektechnologie Taalmodellen op basis van tekst slides en gesproken tekst (ASR) Koppeling Handmatig Demo
13 Entry Point Retrieval 13 Handelingen der Staten Generaal heel veel lange (vaak best saaie) documenten... met heel veel interne structuur en metadata... nu ontzettend slecht ontsloten Voorbeeld zoek op knettergek in Parlando
14 Entry Point Retrieval 14 Waarom de Handelingen? Wetenschappelijk razend interessant en uitdagend bijna 200 jaar aan digitale data (via SGD project) data zit vol met structuur complexe zoekopdrachten buitenland (UK, België, Ierland) loopt op ons vooruit
15 Entry Point Retrieval 15 Heel veel data Handelingen der Staten Generaal vanaf 1984 nu al digitaal beschikbaar. Bijna Kamervragen; meer dan 1 miljoen uitspraken in debatten, meer dan 200 miljoen woorden. Groeit dagelijks met tientallen documenten.
16 Entry Point Retrieval 16 Type documenten: aantallen per partij Data van 1984 tot Mei 2008.
17 Entry Point Retrieval 17 Tekst extractie en verrijkings voorbeeld <spreker pagina=" " anker="568" partij="sp" naam="van Gerven" PDCid="03116"> Ik heb gezien dat de amendementen inmiddels in Parlando staan. </spreker>
18 Entry Point Retrieval 18 Technologie 1. pdftotext, 2. structuur expliciet maken dmv reguliere expressies 3. van platte naar diepe structuur met xsl:for-each-group uit XSLT (Muenchian Method Goddank niet meer nodig)
19 Entry Point Retrieval 19 Voorbeeld van gebruik parlando knettergek
20 Entry Point Retrieval 20 Zoeken in de Handelingen: Conclusies Omzetten van platte tekst naar diepe XML biedt vele nieuwe mogelijkheden. Technisch voordeel: veel kleinere files
21 Entry Point Retrieval 21 Technisch voordeel Handelingen van voor 1995 zijn ingescand en OCRed Heel erg grote files: vergadering van 72 bladzijdes: 24 Mb PDF en slechts.5 Mb in XML, en slechts 150 Kb in XML.gz Duur in opslag en benodigde bandbreedte Alternatief: origineel weer opbouwen uit de XML.gz
22 Entry Point Retrieval 22 Origineel weer opbouwen Dit kan in query-time. Voorbeeld bestand kost minder dan 1.5 seconde. Nadeel: OCR-fouten staan erin. Het is géén facsimilé. Zie trading-space-for-time/
23 Entry Point Retrieval 23 Overzicht praatje: nieuwe mogelijkheden 1. Handelingen als Web 2.0 documenten Nieuwe manieren van zoeken: op personen en partijen Nieuwe manieren van analyse: debatstijdlijnen. 2. Kruisverbanden met andere media Video Verbonden Bronnen 3. Nieuwe mogelijkheden en toepassingen Bieden van historische context Profielen van politici.
24 Entry Point Retrieval 24 Zoeken op personen Nu statische bio s op parlement.com en tweedekamer.nl Wens dynamische gegevens (als in UK, Ierland, EU) alles gezegd in de Kamer alle gestelde vragen alle ingediende moties Realisatie Mogelijk met PoliDocs XML structuur.
25 Entry Point Retrieval 25 Tijdslijn van debatten Elk debat is onderverdeeld in onderwerp blok spreker structuur in XML. Maakt eenvoudige debatsanalyse mogelijk. Voorbeeld vragen: Wie valt wie aan? Wie interrumpeerde het meest? Wie was het langst aan het woord? Wat was opvallend aan een betoog van een spreker? Voorbeeld: Algemene beschouwingen 17 Sept 2008
26 Entry Point Retrieval 26 Overzicht praatje: nieuwe mogelijkheden 1. Handelingen als Web 2.0 documenten 2. Kruisverbanden met andere media Video Verbonden Bronnen 3. Nieuwe mogelijkheden en toepassingen Bieden van historische context Profielen van politici.
27 Entry Point Retrieval Kruisverbanden met andere media en andere documenten 1. koppeling van Handelingen aan video verslag 2. koppelen van Kamervragen aan hun bronnen 27
28 Entry Point Retrieval 28 Handelingen en video Veel gemeentes tonen hun raadsverslagen al samen met video. Mooie Kans: TK neemt alles al op op video Automatische Koppeling door spraak en spreker herkenning Demo op <spreker naam="de voorzitter" pagina=" " anker="66" timecode="00:07:07"> Wij gaan niet het cv van de heer Bosma doornemen. </spreker>
29 Entry Point Retrieval 29 Kamervragen: diepe dataextractie Uitgangspunten 1. Zoveel mogelijk impliciete data expliciet maken: vragen antwoorden voetnoten bronnen datums URLs personen partijen functies/rollen Normaliseren van tijdsaanduidingen, bronverwijzingen, persoonsen partij-namen 3. Automatisch verbinden van data-bronnen
30 Entry Point Retrieval 30 Kamervragen en hun bronnen Kamervragen verwijzen vaak naar een bron Vraag 1 Bent U bekend met... 1 Wens: koppeling van kamervraag en bron dmv hyperlink Extractie levert inzicht op: actualiteit van de vragen soort bronnen 1 Zo links zijn de kranten niet. De Dag,
31 Entry Point Retrieval 31 Extractie van bronnen Voorbeeld: In onze XML database: <vragen aantal= 7 > <vraag nummer= 1 voetnoot= 1 > Kent u het bericht dat de politie hangjongeren registreert? <voetnoot nummer= 1 /> </vraag>... <noten afkomstig= vraag > <noot nummer= 1 koppeling= datum= bron= NOS Journaal > NOS Journaal, 31 april 2007 </noot> </noten> </vragen>
32 Entry Point Retrieval 32 Actualiteit van de Kamervragen
33 Entry Point Retrieval 33 KamerVragen: Welke kranten gebruiken de partijen als bron?
34 Entry Point Retrieval 34 Overzicht praatje: nieuwe mogelijkheden 1. Handelingen als Web 2.0 documenten 2. Kruisverbanden met andere media Video Verbonden Bronnen 3. Nieuwe mogelijkheden en toepassingen Data kwaliteits management Profielen van politici.
35 Entry Point Retrieval 35 Data kwaliteits management 1 Verschillende schrijfwijzen terugbrengen naar dezelfde persoon Aadsted-Madsen Aasted Madsen Aasted-Madsen Aasted Madsen-Stiphout Aasted Madsen - van Stiphout Aasted-Madsen van Stiphout Aasted-Madsen-van Stiphout Aasted Madsen-Van Stiphout
36 Entry Point Retrieval 36 Data kwaliteits management 2 Verbeteren van OCR-fouten in SGD data FvdA FVdA PcdA pda PdA PF P>dA Pvc)A PvciA PvciA PvclA pvda Pvd.A PvdA PvDA PviiA PvriA PvrJA PvtiA PWD PydA
37 Entry Point Retrieval 37 Koppeling van gebeurtenissen aan kamerleden Toepassingen: Geef nieuws aan kamerleden op basis van hun specialisme. Filteren van nieuws: Bekijk alleen dit nieuws Attenderen: Dit mag je niet missen Techniek Maak een expertise profiel van elk kamerlid op basis van zijn/haar uitspraken in de Kamer. Benodigde data: Handelingen in XML formaat.
38 Entry Point Retrieval 38 Demo: Welke tien politici passen het beste bij dit bericht? Groep_militairen_blijft_in_ Uruzgan.html Acht van de tien hits zitten in de commissie defensie.
39 Entry Point Retrieval 39 Conclusies Semantische verrijking van Handelingen is haalbaar, biedt ongekende mogelijkheden, is wetenschappelijk vooruitstrevend, en maakt zoeken in de Handelingen leuk door entry-point retrieval
1 In de Handelingen browsen, zoeken en vinden. Maarten Marx Universiteit van Amsterdam 3 November 2008
www.polidocs.nl 1 www.polidocs.nl In de Handelingen browsen, zoeken en vinden. Maarten Marx Universiteit van Amsterdam 3 November 2008 www.polidocs.nl 2 Wie zijn we? Prof Dr Maarten de Rijke. Leerstoel
Nadere informatie1 In de Handelingen browsen, zoeken en vinden. Maarten Marx Universiteit van Amsterdam 3 November 2008
www.polidocs.nl 1 www.polidocs.nl In de Handelingen browsen, zoeken en vinden. Maarten Marx Universiteit van Amsterdam 3 November 2008 www.polidocs.nl 2 Wie zijn we? Prof Dr Maarten de Rijke. Leerstoel
Nadere informatieText Mining/Linked Data
Text Mining/Linked Data 1 Text Mining/Linked Data Maarten Marx Universiteit van Amsterdam Den Haag 2010-02-09 Text Mining/Linked Data 2 Doel van project 1. impliciete verbanden in Kamerstukken expliciet
Nadere informatieTekstuele databestanden
Tekstuele databestanden 1 Tekstuele databestanden Maarten Marx Universiteit van Amsterdam 2 December 2009 Tekstuele databestanden 2 Wie ben ik? Politicoloog en informaticus. Specialismes: Kennisrepresentatie,
Nadere informatiePolitical Mashup Kickoff Meeting
PoliticalMashup 1 Political Mashup Kickoff Meeting Marina Lacroix en Maarten Marx www.politicalmashup.nl 19 Maart 2008, De Burcht, Amsterdam PoliticalMashup 2 Political Mashup: wat is dat voor een project?
Nadere informatieInformatiekunde 1. Informatiekunde. Een greep uit het werk van mijn studenten. Maarten Marx. 10 Jaar Informatie Wetenschappen
Informatiekunde 1 Informatiekunde Een greep uit het werk van mijn studenten Maarten Marx 10 Jaar Informatie Wetenschappen 2013-10-25 1 Informatiekunde 2 Inhoud Volstrekt subjectieve greep uit werk van
Nadere informatieHet Semantisch Web Remco de Boer (ArchiXL)
Het Semantisch Web Remco de Boer (ArchiXL) Mini-seminar Het nieuwe kenniswerken 31 januari 2013 Utrecht 1 Remco de Boer? 2 Syntactische ambiguïteit Time flies like an arrow Fruit flies like a banana 3
Nadere informatieLinked data als klittenband voor de Basisregistraties en meer!
Live : Linked Data & Basisregistraties Linked data als klittenband voor de Basisregistraties en meer! Erwin Folmer, 30-9-2015 (slides hergebruikt van Linda van den Brink) Het project BGT Linked Data Drie
Nadere informatieSourcing & Technologie. Gerard Mulder, Commercieel directeur, mulder@textkernel.nl, 06-26064090
Sourcing & Technologie Gerard Mulder, Commercieel directeur, mulder@textkernel.nl, 06-26064090 Textkernel introductie Agenda Wat is sourcing? Hoe kan Textkernel technologie sourcing ondersteunen? Demo
Nadere informatieHardware Specialisatie. Module 1: Zoeken op het internet
1 Hardware Specialisatie Module 1: Zoeken op het internet 2 Inhoud Inleiding Zoekmachines Usenet en nieuwsgroepen Praktijkoefening 3 Inhoud > Inleiding < Zoekmachines Usenet en nieuwsgroepen Praktijkoefening
Nadere informatieWat kan linked data betekenen voor de Basisregistratie Grootschalige Topografie?
Het project: BGT Linked Data Wat kan linked data betekenen voor de Basisregistratie Grootschalige Topografie? Linda van den Brink, 12-2-2015 Door: In opdracht van Basisregistratie Grootschalige Topografie
Nadere informatieHet ontsluiten van Nederlandse Parlementaire Publicaties naar Brits voorbeeld
Afstudeerproject Bachelor Informatiekunde 2008 Universiteit van Amsterdam Het ontsluiten van Nederlandse Parlementaire Publicaties naar Brits voorbeeld Naam student: Tim Gielissen E-mail: Tim.Gielissen@student.uva.nl
Nadere informatieChoral + Spraaktechnologie: ingezet voor de ontsluiting van audiovisuele
Choral + Spraaktechnologie: ingezet voor de ontsluiting van audiovisuele archieven De benadering Doel van het NWO CATCH project CHoral (2006-2011): onderzoek en ontwikkel geautomatiseerde annotatieen zoek
Nadere informatieZoeken binnen Pleio Moderne zoektechnologie in een sociale omgeving
Zoeken binnen Pleio Moderne zoektechnologie in een sociale omgeving Next2Know, maart 2014 Inhoud Zoeken op Pleio... 1 De pijlers van Pleio... 1 Information Retrieval als sociale activiteit... 1 Geavanceerd
Nadere informatiestudie waarmee we de principes van de analyse willen demonstreren. Een volledig beschrijving van de algoritmen en de resultaten zijn te vinden in
Bio-informatica kan omschreven worden als het toepassen van algoritmen om meerwaarde te verkrijgen uit data afkomstig van biomedisch en/of biologisch onderzoek. In bio-informatica wordt onderzoek gedaan
Nadere informatieOP EN IN HET WEB. Hoe de toegankelijkheid van juridische informatie kan worden verbeterd
OP EN IN HET WEB Hoe de toegankelijkheid van juridische informatie kan worden verbeterd Marc van Opijnen Kennis- en Exploitatiecentrum Officiële Overheidspublicaties 14 mei 2014 KNVI-JI, Den Haag marc.opijnen@koop.overheid.nl
Nadere informatieRekenen met het recht
Rekenen met het recht Hoe linked data jurisprudentie toegankelijker kan maken PiLOD 2.0, Den Haag 13 november 2013 Marc van Opijnen Kennis- en Exploitatiecentrum Officiële Overheidspublicaties (KOOP /
Nadere informatieMaken van een woordenboek:4 hoofdfasen
Maken van een woordenboek:4 hoofdfasen 1. het maken van een concept + het testen van het concept door middel van proefartikelen hoe moet je woordenboek er inhoudelijk uitzien? 2. opbouw van een materiaalverzameling
Nadere informatie1Publiceer niet alleen informa=e over het primaire proces maar ook alle informa=e
Vijf aanbevelingen voor een Open Tweede Kamer Publiceer alle parlementaire documenten (inclusief de Handelingen) op zo n manier dat ze geschikt zijn voor geautoma=seerd hergebruik Dat wil zeggen dat de
Nadere informatieReal Time Monitoring & Adaptive Cyber Intelligence SBIR13C038
Real Time Monitoring & Adaptive Cyber Intelligence SBIR13C038 Opgericht 2010 Ervaring >10 jaar Expertise Forensisch gegevensonderzoek Anomalie detectie Behavioral profiling SBIR Partners TNO Texar Data
Nadere informatieUITGEVERIJ VAN DE TOEKOMST: TAKEN & EERSTE INITIATIEVEN MULTIMEDIA LAB
UITGEVERIJ VAN DE TOEKOMST: TAKEN & EERSTE INITIATIEVEN MULTIMEDIA LAB Wesley De Neve, Miel Vander Sande, Tom De Nies, Erik Mannens Universiteit Gent IBBT Faculteit Ingenieurswetenschappen en Architectuur
Nadere informatieWie Maarten Marx M.J.Marx@uva.nl T 020 525 2888 M 06 4001 6120. Wanneer 19 maart 2008 10 00 15 30 uur
Wanneer 19 maart 2008 10 00 15 30 uur Wie Maarten Marx M.J.Marx@uva.nl T 020 525 2888 M 06 4001 6120 Waar De Burcht Henri Polaklaan 9 Amsterdam www.deburcht.org Wat Het Political Mashup-project heeft als
Nadere informatieDe voorzitter van de Tweede Kamer der Staten-Generaal Postbus 20018 2500 EA DEN HAAG
> Retouradres Postbus 20011 2500 EA Den Haag De voorzitter van de Tweede Kamer der Staten-Generaal Postbus 20018 2500 EA DEN HAAG Programmadirectie Dienstverlening Regeldruk en Informatiebeleid Afdeling
Nadere informatie1 Deelproject Spraakherkenning: SHoUT Audio Indexering Service
1 Deelproject Spraakherkenning: SHoUT Audio Indexering Service De in het CHoral project ontwikkelde audio-indexeringstechnologie op basis van automatische spraakherkenning (SHoUT) wordt beschikbaar gemaakt
Nadere informatieProces Mediaverwerking
Proces Mediaverwerking Anne Werst, manager Catalogiseren awerst@beeldengeluid.nl Nederlands Instituut voor Beeld en Geluid Cijfers Ruim 750.000 uur radio, televisie, film 1.500.000 catalogusbeschrijvingen
Nadere informatieHET ZOEKEN VAN WETENSCHAPPELIJKE LITERATUUR. Hans Bodlaender
HET ZOEKEN VAN WETENSCHAPPELIJKE LITERATUUR Hans Bodlaender Deze presentatie 2 Wat voor soort literatuur bestaat er? Hoe wordt die gemaakt? Hoe vind je relevante literatuur? Gebruik bronnen 3 Voordat je
Nadere informatieOnderdeel: van Gedistribueerde voorzieningen voor duurzame toegang (A.1)
BESCHRIJVING CASE STUDY PROJECT DDS HERLEEFT Onderdeel: van Gedistribueerde voorzieningen voor duurzame toegang (A.1) Dit document bestaat uit twee delen: 1. Project DDS herleeft Beschrijving van het hele
Nadere informatieE Invoicing, wat is het nu precies en wat zijn de ontwikkelingen? dé P2P specialist van Nederland
E Invoicing, wat is het nu precies en wat zijn de ontwikkelingen? dé P2P specialist van Nederland Welkom Proquro klanten! Agenda 10.00 11:30 Ontwikkelingen, visie en productlancering Proquro e Facturen
Nadere informatie1. Databanken. Wat is een databank? Verschillende opslagmethodes
1. Databanken Wat is een databank? Verschillende opslagmethodes Tekst bestanden Spreadsheet Relationele gegevensbanken Relationeel model De gestandaardiseerde opvraagtaal SQL Beheer van een mysql databank
Nadere informatieNummer 2 - Februari 2012. De marketing van internetshoppen. Wat de tablet voor een tijdschrift kan doen. Nieuwe vs. oude media. De perfecte vormgeving
Nummer 2 - Februari 2012 Wat de tablet voor een tijdschrift kan doen De marketing van internetshoppen Nieuwe vs. oude media De perfecte vormgeving RUBRIEKEN 8 Column: Sak van den Boom 45 Agenda p. 46 18
Nadere informatieXML/JSON vacaturefeeds
Tangram Internet Services: XML/JSON vacaturefeeds Uitleg en voorwaarden gebruik Tangram XML/JSON vacaturefeeds Datum: 18.10.2012 Versie: 1.0 Tangram biedt geavanceerde Internet Services die naadloos aansluiten
Nadere informatieDe combinatie van verrijkingen, machine learning en crowd sourcing
Verbetering vindbaarheid en bruikbaarheid van de digitale content van de KB De combinatie van verrijkingen, machine learning en crowd sourcing Theo van Veen, 31-1-2017 Theo van Veen, 31-1-2017 Verrijken:
Nadere informatieAFO 653 RSS Nieuwsfeeds
AFO 653 RSS Nieuwsfeeds 653.1 Inleiding 653.1.1 Wat zijn RSS News Feeds en hoe worden ze in Vubis Smart gebruikt? RSS News Feeds RSS (Really Simple Syndication) is een XML-gebaseerd formaat voor het distribueren
Nadere informatiePaper Z811-3 Content en Distributie
Instituut voor Media en Informatie Management Paper Z811-3 Content en Distributie Paper Erik de Groot, ZV11 Docent Raoul Boers 27-03-2009 Inhoud Paper Metadata The narrow view Verdrinken in een informatiestroom
Nadere informatieHoe selecteer je preserveringstools? Sara van Bussel. Koninklijke Bibliotheek
Hoe selecteer je preserveringstools? Sara van Bussel Koninklijke Bibliotheek Hoe selecteer je preserveringstools? Het probleem van digitale duurzaamheid Types digitale preservering Preserveringstools in
Nadere informatieKennissessie INSPIRE. Algemene vereisten & architectuur Metadata View Services Download Services Ondersteuning vanuit Geonovum.
Kennissessie Algemene vereisten & architectuur Metadata View Services Download Services Ondersteuning vanuit Geonovum Thijs Brentjens Inhoud Download Services Pre-defined datasets via Atom feeds Pre-defined
Nadere informatieCatchPlus Workspaces. Patricia Alkhoven. CatchPlus. Gert-Jan van Dijk. Target Media BV. Datum: 27 april - 2011. Versie: 1.0
CatchPlus Workspaces Tav: Auteur: Patricia Alkhoven CatchPlus Gert-Jan van Dijk Target Media BV Datum: 27 april - 2011 Versie: 1.0 1. Inleiding Achtergrond Onder de projectnaam Scratch4all is er een samenwerking
Nadere informatieTheorie Toets 1 voor Klas 3
Theorie Toets 1 voor Klas 3 - Pagina 1 Theorie Toets 1 voor Klas 3 Theorie Schrijven voor Print & Web Een goede tekst maken is moeilijk. Tekst-schrijver is daarom ook een beroep. Tekst-schrijvers schrijven
Nadere informatieDIGITAAL PROCESDOSSIER POLITIE
DIGITAAL PROCESDOSSIER POLITIE RON BOELSMA EN FLORIS BEX SOFTWAREPROJECT BACHELOR INFORMATICA INTRODUCTIE De Nederlandse Politie krijgt steeds meer te maken met grote, complexe zaken, waarin een speld
Nadere informatieWordt educatief videomateriaal in Nederland vaak ondertiteld? Welke vormen van ondertitelen zijn mogelijk?
Wordt educatief videomateriaal in Nederland vaak ondertiteld? Welke vormen van ondertitelen zijn mogelijk? Weblecture perspectief Nee, want.. Automatisering dillema s OCR (optical character recognition),
Nadere informatieSysteemarchitecturen en opslag van gegevens
Systeemarchitecturen en opslag van gegevens Deel 3: zoeken in ongestructureerde gegevens Dr. Wilfried Lemahieu wilfried.lemahieu@econ.kuleuven.ac.be Gestructureerde versus ongestructureerde gegevens De
Nadere informatieZelftest Informatica-terminologie
Zelftest Informatica-terminologie Document: n0947test.fm 01/07/2015 ABIS Training & Consulting P.O. Box 220 B-3000 Leuven Belgium TRAINING & CONSULTING INTRODUCTIE Deze test is een zelf-test, waarmee u
Nadere informatieCase7: Sensordata. Arnoud de Jong en Matthijs Vonder. 12 maart 2014
Case7: Sensordata Arnoud de Jong en Matthijs Vonder 12 maart 2014 1 Agenda Status update Demo behind the scenes Next steps Strategieën voor Sensor Data opslag 2 Status update - bijeenkomsten Pilod bijeenkomst
Nadere informatieOnderzoeksdata en toegangsrechten
Onderzoeksdata en toegangsrechten Jacquelijn Ringersma Max Planck Instituut voor Psycholinguïstiek Nijmegen Max Planck Instituut voor psycholinguïstiek Max Planck Gesellschaft 78 onderzoeksinstituten (Duitsland)
Nadere informatieCV Sander Flight. Workshop cameratoezicht. Innovatiecongres Veiligheid 19 mei 2010
Innovatiecongres Veiligheid 19 mei 2010 Workshop cameratoezicht In 1980 werden videocamera's en -recorders ineens betaalbaar voor iedereen. Sindsdien is de kwaliteit van camera's en recorders alleen maar
Nadere informatieGEEN ZIN IN OVERTYPEN?
GEEN ZIN IN OVERTYPEN? VERSNEL UW BUSINESS DOOR: AUTOMATISCHE DATA INVOER W ORKFLOW VOOR GOEDKEURING TIJDENS HET INKOOPPROCES DIGITAAL DOCUMENT ARCHIEF DOCUMENT CAPTURE Document Capture voor Dynamics NAV
Nadere informatieEffectief opslaan en terugvinden van informatie OFFICE FILING
Effectief opslaan en terugvinden van informatie OFFICE FILING Snelle toegang tot uw dossiers optimaliseert uw productiviteit Informatie vormt de levenslijn binnen uw onderneming de basis van effectieve
Nadere informatieVAN PAPIERSTROOM NAAR INFORMATIESTROOM
VAN PAPIERSTROOM NAAR INFORMATIESTROOM MET ZELF LERENDE DOCUMENTHERKENNING Een continue stroom aan binnenkomende post en interne documenten. Wie herkent het niet? Het vergt tijd en energie om al deze documenten
Nadere informatieDe Outlook en SharePoint integratie
Direct vanuit Outlook e-mailberichten en/of bijlagen opslaan in SharePoint ( drag and drop ). GeONE is uw partner voor SharePoint Informatie Management. Alle document management functionaliteiten beschikbaar
Nadere informatieKoppeling tussen Legal Intelligence en BaseNet
Koppeling tussen Legal Intelligence en BaseNet White Paper 1/7 Legal Intelligence & Basenet Basenet is een online Document Management Systemen (DMS) systeem dat o.a. voorziet in dossier-, urenadministratie-
Nadere informatieEindverslag. Project VolgMijnStem. Ben Teeuwen, project manager VolgMijnStem Stichting Het Nieuwe Stemmen 13 juni 2012, Utrecht
1 Eindverslag Project VolgMijnStem Ben Teeuwen, project manager VolgMijnStem Stichting Het Nieuwe Stemmen 13 juni 2012, Utrecht Lex Slaghuis, voorzitter Open State Foundation 11-03-2013 2 Inleiding Dit
Nadere informatieTYPO3 redacteuren cursus
TYPO3 redacteuren cursus Inleiding Voorstellen docent Communicatie Expertise Centrum (CEC) Voorstellen cursisten Aanwezigheidsformulier Evaluatieformulier / e-mailadres Reden: verbeteren cursus Doel:TYPO3
Nadere informatieinformatie architectuur lesweek 4 IAM V
informatie architectuur lesweek 4 IAM V1. 2009-2010 vandaag tags metadata controlled vocabulary search IAM informatie architectuur Herkennen, structureren en vindbaar maken van informatie. containerbegrip
Nadere informatieGebruikersvriendelijke beheer van bestanden in SharePoint
#1 Oplossing wereldwijd. Bewezen in omgvangrijke omgevingen 100+ en 10.000+ gebruikers. GeONE is uw partner voor SharePoint Informatie Management. GeONE levert het volledige pakket aan SharePoint toepassingen
Nadere informatieKoppeling Profit <> Textkernel
Koppeling Profit Textkernel Vionq Vianen UT Documenttoelichting Dit is de technische beschrijving van deze geregistreerde partnerkoppeling. Dit document beschrijft de standaard van de koppeling op functioneel
Nadere informatieKoppeling Profit <> Textkernel
Koppeling Profit Textkernel Vionq Vianen UT Documenttoelichting Dit is de technische beschrijving van deze geregistreerde partnerkoppeling. Dit document beschrijft de standaard van de koppeling op functioneel
Nadere informatieStappenplan zoeken en verwerken van informatie
Stappenplan zoeken en verwerken van informatie Oriëntatie op het onderwerp Wat is het onderwerp? Welke zoektermen? Welke bronnen? Zoeken naar informatie Welke informatiebron gebruik je? Hoe zoek je digitale
Nadere informatieLes 10 : Aanmaken van een database (deel2).
Les 10 : Aanmaken van een database (deel2). Wat is een database? Een centrale opslagruimte voor gegevens. Alle informatie wordt centraal opgeslagen en kan door iedereen geraadpleegd worden. Voordelen van
Nadere informatieWikipedia Molenproject. Quistnix en AKoopal
Wikipedia Molenproject Quistnix en AKoopal Wikipedia Molenproject 2007: Het jaar van de molens Een plan borrelt op bij Quistnix:» Iedere bestaande Nederlandse molen een eigen artikel Positief: Leuk schrijfproject
Nadere informatieWhitepaper toegankelijke pdf
Whitepaper toegankelijke pdf Wat is een toegankelijke pdf? Waarom moeten pdf s toegankelijk zijn en hoe maak je een pdf toegankelijk? In deze gratis whitepaper vind je het antwoord op deze vragen. Sander
Nadere informatieLang leve de lokale lobby?!
Lang leve de lokale lobby?! Bijdrage door Noortje Thijssen aan nieuwjaarsreceptie Welcom Amsterdam Amsterdam, 11 januari 2018 Even voorstellen Pagina 2 2017 Universiteit van Amsterdam & Public Matters
Nadere informatieWaarom automatiseren?
Chris De Clercq Waarom automatiseren? Wanneer u uw manier van werken hebt geautomatiseerd, zal u zich afvragen hoe u het vroeger zonder heeft gedaan Automatiseren helpt u bij: - communicatie efficiënter
Nadere informatieStappenplan zoeken en verwerken van informatie
Stappenplan zoeken en verwerken van informatie Oriëntatie op het onderwerp Wat is het onderwerp Welke zoektermen Welke bronnen Zoeken naar informatie Welke informatiebronnen Kiezen en beoordelen van informatie
Nadere informatiePas op voor de besmettelijke PORTFOLIOSIS!
Pas op voor de besmettelijke PORTFOLIOSIS! Nadenken Voorbereiding Maken Presenteren NADENKEN Nadenken Voorbereiding Maken Presenteren Soul-searching Persoonlijkheid Ervaring Doelen Waarden Sterktes en
Nadere informatieCyberpesten: social media platform mining tools
Cyberpesten: social media platform mining tools ABI team 27: Pascal Pieters, Stephaan Declerck Begeleider: dr. Rik Bos Opdrachtgever: prof. dr. ir. Remko Helms Inhoud Achtergrond Opdracht Projectaanpak
Nadere informatieHUB. non lineair ---
HUB non lineair 1 juli 2016 2 INLEIDING Digitale workflow De OLON MediaHub non lineair (verder te noemen de MediaHub) is een backend systeem dat de oplossing biedt voor de meest complexe vraagstukken op
Nadere informatieWorkshop 6: aan de slag met leuke dingen in Atlas
Workshop 6: aan de slag met leuke dingen in Atlas Prepublicatie Omgeving (maken & verwerken van kaarten) 1. Ga naar de acceptatieomgeving van de Atlas Leefomgeving: http://atlas-leefomgeving-acc.geodan.nl/
Nadere informatieFunctionele Componenten Release 2.1
Functionele Componenten Release 2.1 1 OCTOBOX is rule-based software die ingezet wordt voor de verwerking en afhandeling van inkomend berichtenverkeer. De software is voor meerdere doeleinden toepasbaar
Nadere informatieWorkshop CBS data. Dennis Ramondt
Workshop CBS data Dennis Ramondt Inhoud workshop Ø Inleiding CBS ØCijfers van CBS Ø Welke informatie is interessant (actief) Ø Gebruiken van de informatie 2 CBS in cijfers Ø1899 opgericht Ø2.036 medewerkers
Nadere informatieWat is de positie binnen de eigen organisatie? De cursus wordt gegeven binnen een elective in het afstandsonderwijs.
Pilot 3: UM VCR Pilot Naam Instelling VCR course UM UM Studenten Aantal Ronde 2 Datum uitvoering 2011 Contactpersoon Katerina Bohle Carbonel Introductie van de pilot. Waarom deze pilot? Doelstelling Voor
Nadere informatieHandleiding. Online Order Entry Website. Door: Datum: Versie:
Handleiding Online Order Entry Website Door: Datum: Versie: 2 Handleiding Online Order Entry Website Inhoudsopgave Inhoudsopgave... 2 Inleiding... 3 De OOE... 4 Functionaliteiten... 5 Online Order Entry...
Nadere informatie, 2018 Martien Vos. Presentatie RedForce
, 2018 Martien Vos Presentatie RedForce Voorstellen Martien Vos Redforce / DPA (NL) Kennis van Linked (Open) Data Dataintegratie Geografische Systemen Bigdata Datamigratie DPA Group DPA Group N.V. DPA
Nadere informatieEen nieuwe prosopografie van predikanten: mogelijkheden en valkuilen van DH-tools God in Nederland 3.0, 21 November, 2014
Een nieuwe prosopografie van predikanten: mogelijkheden en valkuilen van DH-tools God in Nederland 3.0, 21 November, 2014 Serge ter Braake & Antske Fokkens Een geschiedenis van historische databases Eind
Nadere informatieLIVE WEBINAR UITZENDEN
LIVE WEBINAR UITZENDEN met Google Hangouts on Air WEBINARGEEK.COM INTRODUCTIE Voor het uitzenden van een live webinar met WebinarGeek heb je een Google account nodig. Dat is nodig omdat er gebruik wordt
Nadere informatieDe meest complete informatievoorziening voor de publieke sector
De meest complete informatievoorziening voor de publieke sector van de makers van legal intelligence Inleiding Legal Intelligence is groot geworden met haar innovatieve zoeksysteem voor alle juridische
Nadere informatieFunctionele Componenten
Functionele Componenten 1 OCTOBOX is rule-based software die ingezet wordt voor de verwerking en afhandeling van inkomend berichtenverkeer. De software is voor meerdere doeleinden toepasbaar en richt de
Nadere informatieHandleiding leerkracht
Handleiding leerkracht Lien Nijs en Britt Taels Inleiding Omdat het lesmateriaal rond de Europese unie niet erg uitgebreid is, willen wij in opdracht van onze CGP informatica hier verandering in brengen.
Nadere informatieSocial Media Workshop. YM consulting
Social Media Workshop YM consulting Even voorstellen Patrick Ariëns Erik Jobse Robin Koster Ipetje op / Ipetje af Verwachtingen? Wat verstaan we onder netwerken? Netwerken is het offline en online leggen
Nadere informatieB.Sc. Informatica Module 4: Data & Informatie
B.Sc. Informatica Module 4: Data & Informatie Djoerd Hiemstra, Klaas Sikkel, Luís Ferreira Pires, Maurice van Keulen, en Jan Kamphuis 1 Inleiding Studenten hebben in modules 1 en 2 geleerd om moeilijke
Nadere informatieIHW Netwerkdag DD API DD API DD API DD API. Algemene informatie over deze workshop Algemene informatie over programma Digitale Delta
IHW Netwerkdag Algemene informatie over deze workshop Algemene informatie over programma Digitale Delta Praktijk casus 1 Proactief ophalen van randvoorwaarden middels invullen van post-its Verzamelen input
Nadere informatieSneller en gemakkelijker. plannen met Time-Wize Planning
Sneller en gemakkelijker plannen met Time-Wize Planning Time-Wize Planning Betere grip op arbeidstijd en daarmee personeelskosten Hoeveel medewerkers zijn er? Wie is er wanneer? Wie gaat het werk doen?
Nadere informatieHANDLEIDING. CONTENT MANAGEMENT SYSTEEM - CJG APP / versie 2. STAP 1 - Maak uw CJG aan in de App. 1. Surf naar http://esm.cjgapp.
HANDLEIDING CONTENT MANAGEMENT SYSTEEM - CJG APP / versie 2 STAP 1 - Maak uw CJG aan in de App 1. Surf naar http://esm.cjgapp.nl 2. Gebruik je username en wachtwoord om in te loggen 3. Ga naar Start >
Nadere informatieSWAY: MICROSOFTS ANTWOORD OP PREZI?
SWAY: MICROSOFTS ANTWOORD OP PREZI? Het presentatieprogramma PREZI heeft de tekorten van PowerPoint en Keynote (Apple) aangevuld. Maar Microsoft heeft nu ook ingezien dat gebruikers iets eenvoudigers én
Nadere informatieResearch & development
Research & development Publishing on demand Workflow ondersteuning Typesetting Documentproductie Gespecialiseerd document ontwerp Web ontwerp en onderhoud Conversie Database publishing Advies Organisatie
Nadere informatieDE BELEVING VAN BRANDED CONTENT OP DIGITALE DEVICES SANOMA MEDIA
DE BELEVING VAN BRANDED CONTENT OP DIGITALE DEVICES SANOMA MEDIA januari 2013 ONDERZOEKSOPZET Begin 2012 hebben Sanoma Media en Metrixlab een onderzoek afgerond met de volgende onderzoeksvraag: Wanneer
Nadere informatieOCR Technieken OCR Optical Character Recognition ICR Intelligent Character Recognition OMR Optical Mark Recognition Barcode Handschrift
OCR Technieken OCR Optical Character Recognition ICR Intelligent Character Recognition OMR Optical Mark Recognition Barcode Handschrift Ondersteuning image processing Vaste formulier verwerking Semi-gestructureerde
Nadere informatieHaaglanden Medisch Centrum
Cloud oplossing in Haaglanden Medisch Centrum 26 september 2016 Agenda I. Introductie Haaglanden MC II. Situatieschets (voor implementatie) III. Probleemstelling huidige situatie IV. Doelstelling V. Pakket
Nadere informatieEEN GEAVANCEERDE AV OPLOSSING VOOR UW RAADSVERGADERING
EEN GEAVANCEERDE AV OPLOSSING VOOR UW RAADSVERGADERING GEAUTOMATISEERDE WORKFLOW Tijdens een webcast van een vergadering automatisch accurate metadata zoals sprekersinformatie en agendapunten tonen? Live
Nadere informatieLIVE WEBINAR UITZENDEN
LIVE WEBINAR UITZENDEN met Google Hangouts on Air WEBINARGEEK.COM INTRODUCTIE Voor het uitzenden van een live webinar met WebinarGeek heb je een Google account nodig. Dat is nodig omdat er gebruik wordt
Nadere informatieDe voordelen van Drupal
Drupal is een open source Content Management System (CMS). Daarnaast kun je Drupal zien als een framework, dit betekent dat je modules (oftewel mini-applicaties) kunt implementeren in je installatie van
Nadere informatieDeze presentatie. Gebruik bronnen. Wat voor bronnen? ZOEKEN VAN WETENSCHAPPELIJKE LITERATUUR
Deze presentatie 2 Wat voor soort literatuur bestaat er? Hoe vind je relevante literatuur? ZOEKEN VAN WETENSCHAPPELIJKE LITERATUUR Hans Bodlaender Onderzoeksmethoden Gebruik bronnen Wat voor bronnen? 3
Nadere informatieOnline branding. Het nieuwe meten van merken via sociale media. L. de Vries M.Sc. Dr. S. Gensler Prof. dr. P.S.H. Leeflang
Online branding Het nieuwe meten van merken via L. de Vries M.Sc. Dr. S. Gensler Prof. dr. P.S.H. Leeflang Rapport CIC-201203 ISBN 978-90-367-5937-3 CIC 2 Inhoudsopgave Managementsamenvatting pag. 3 Waarom
Nadere informatieEEN COMPLEET NIEUWE FELNET-WEBSITE: WEGWIJS VOOR EN ACHTER DE SCHERMEN
EEN COMPLEET NIEUWE FELNET-WEBSITE: WEGWIJS VOOR EN ACHTER DE SCHERMEN Karel Styns Johan Le Maire EMIS Energie- en milieu informatiesysteem Referentie taak uitgevoerd door VITO 20 e verjaardag van de referentietaak
Nadere informatieVan document management naar artificial intelligence. BUSINESS INTELLIGENCE - Dé stap naar toekomstgericht werken
Van document management naar artificial intelligence BUSINESS INTELLIGENCE - Dé stap naar toekomstgericht werken Documentbeheer maakt een significante transformatie door. Van een noodzakelijk archiefstuk
Nadere informatieInternet & Digitaal Rechercheren+
Internet & Digitaal Rechercheren+ Het internet is de grootste informatiebron in onze maatschappij. Door efficiënt gebruik te maken van al deze beschikbare (openbare) bronnen en gegevens kunnen verborgen
Nadere informatiePlone user case: www.mpi.nl
Plone user case: www.mpi.nl Jacquelijn Ringersma Karin Kastens Jos van Berkum Max Planck Instituut voor Psycholinguïstiek Plone gebruikersdag, 16 September 2009 Max Planck Instituut voor Psycholinguïstiek
Nadere informatieGebruikersvriendelijke beheer van bestanden in SharePoint
#1 Oplossing wereldwijd. Bewezen in omgvangrijke omgevingen 100+ en 10.000+ gebruikers. GeONE is uw partner voor SharePoint Informatie Management. GeONE levert het volledige pakket aan SharePoint toepassingen
Nadere informatieWebsite ontwerp. Appledag Klokhuis 29 november 2014 11/29/14
Website ontwerp 1 Maak je site vindbaar Website ontwerp 1 Maak je site vindbaar Laat het professionals doen of doe het zelf! Website ontwerp 1 2 Even voorstellen... Ed Boon Formulierenarchitect en webdeveloper
Nadere informatie1 / 5 BOOZD SEO CHECKLIST
1 / 5 BOOZD SEO CHECKLIST Yes! Onze checklist. Een (kleine) boozd voor jouw online journey. Wij helpen jou graag een stuk op weg met jouw zoekmachine optimalisatie. In deze handige checklist vind je belangrijke
Nadere informatie