SVCN en het Semantische Web een eerste exploratie



Vergelijkbare documenten
De kracht van genetwerkte terminologiebronnen: CATCHPlus en de Cultural Commonwealth Johan Oomen en Hennie Brugman

MultimediaN E-Culture en Prenten Kabinet Online

Van de kast naar de scanner naar het semantisch web: Digitale ontsluiting van cultureel erfgoedmateriaal in projectvorm

Vocabulaire en Alignment Service

Instructies annotatie experiment

Stappenplan Linked (Open) Data voor Archieven

Oratie 24 november 2006: "Over grijpbaarheid en grenzen van kennis"

Semantische technieken, cultureel erfgoed en gebruikers

Workshop Metadata, Ontologieën en het Semantische Web

Linked Open Data en EDM. Jacco van Ossenbruggen Centrum Wiskunde & Informatica (CWI) Vrije Universiteit Amsterdam

Fundamenten in verandering:

Paul Doorenbosch STITCHplus - gebruikerscommissie. Den Haag, Catchplus gebruikerscommissie

NBC+ Collecties beter vindbaar maken Deel 2. Enno Meijers 30 september 2014

Europeana en de digitale ontsluiting van cultureel erfgoed. Workshop 3: Aggregatie

Nr. 6, februari 2010

in het agrifood domein 1 VIAS-symposium

BIJLAGE _functionele_eisen_demonstrator. 1. Opzet project, databank instantie, serverconfiguratie, NoSQL database

Samenvatting Ondersteuning van Documentalisten binnen het Cultureel Erfgoed

Brussel, TiNT 2015 Jef Malliet

Een moderne dienstverlening voor musea en erfgoedinstellingen

CATCHPlus gemeenschappelijke diensten

studie waarmee we de principes van de analyse willen demonstreren. Een volledig beschrijving van de algoritmen en de resultaten zijn te vinden in

Free text of gecontroleerd vocabulaire: een dilemma

informatie architectuur lesweek 4 IAM V

Digitaal Erfgoed: Ontsluiting en semantisch beheer. Netwerk Digitaal Erfgoed

Choral + Spraaktechnologie: ingezet voor de ontsluiting van audiovisuele

voor wie is deze brochure bedoeld?

Beeldende kunst archieven RKD / Nederlands instituut voor Kunstgeschiedenis

Doorlichting technische onderbouw VKC online catalogus. Bert Lemmens PACKED vzw 16 oktober 2012 KMSK Antwerpen

CEST-RICHTLIJNEN INVENTARISEREN. Bert Lemmens & Henk Vanstappen (PACKED vzw)

Proces Mediaverwerking

BRONNENONDERZOEK 2010/2011

Analyse van de beschikbare standaardterminologieën

Haza-21 Handleiding Thesaurus

OpenSKOS / VocabulaireBank

Gebruik van de Art & Architecture Thesaurus binnen Memorix Maior. Deelnemersdag Brabant Cloud 7 juni 2019

Handout Workshop Open Refine

Metadata, informatiestromen

1. Probleemstelling formuleren en sleutelwoorden bepalen.

Op weg naar de Digitale Collectie Nederland 30 september Pieter Vijn Beeld& Geluid

Adlib Archief. Software voor professioneel collectiebeheer in archieven en andere archief beherende instellingen. Flexibel Uitgebreid Veilig

HANDVAARDIGHEID HAVO VAKINFORMATIE STAATSEXAMEN 2016 V15.9.1

Geo-informatie en toegankelijkheid Technische sessie. NCDT 29 oktober 2014 Thijs Brentjens

PROJECT PERSISTENTE IDENTIFICATIE. Alina Saenko, Bert Lemmens, Joris Janssens

PROJECTPLAN. Linked data pilotproject Thesaurus Oorlogsbronnen. project B3-3

Handleiding gebruik digitale boeken Uitgeverij De Boeck

Digitale cultuur als continuüm

De termen kunnen de documenten terugvindbaar maken, maar de termen zijn niet geschikt om de documenten op onderwerp op te bergen.

!!!!!!!!!!!!!!! Open%data:%delen,%verbinden%en%verrijken!!!!!!!!!! Auteurs:!!!!!! Maarten!Zeinstra!!!!!! Nikki!Timmermans!!!!!!!!!!

Modelconvenant toetreding tot de ERFGOEDSUITE

Digitale innovatie voor het erfgoed

Semantiek (met de BAG als voorbeeld) Dienstverlening in verbinding Wetgeving in verbinding 12 maart 2014 Marco Brattinga

Adlib Museum. Veelzijdig Gebruiksvriendelijk Krachtig

CATCHPlus D2.7.2 Lokale triple store DELIVERABLE. D Lokale triple store. René van der Ark Sara van Bussel

Projectsubsidies Cultureelerfgoeddecreet - eerste ronde 2019

Wat kan linked data betekenen voor de Basisregistratie Grootschalige Topografie?

Tekst- en beeldanalyse in één zoekmachine met menselijke trekjes

Het digitale informatielandschap van de toekomst. Jeanine Tieleman Kwaliteitsmedewerker Digitaal Erfgoed Nederland

De Vlaamse Erfgoeddatabanken Contactdag erfgoeddatabanken. 11 juni 2019

Structuren in de chaos?

Plan van aanpak Register

boerderij 2.0 De boerderij als fysiek portaal naar online kennis samenvatting

Rapport onderzoek update scenario s

Uw data op het Web van Data


LINKED DATA OVERHEID Verbetering toegankelijkheid & bruikbaarheid van formele overheidsinformatie. Winst door toepassen van standaarden

GEBRUIKERSHANDLEIDING OPENSKOS voor documentalisten en beheerders

interview Het nieuwe zoeken het nieuwe vinden

Netwerk Digitaal Erfgoed / Werkgroep Monitoring Vragenlijst aan NDE-projecten 2013/2014

Onderdeel: van Gedistribueerde voorzieningen voor duurzame toegang (A.1)

betere "discovery", "delivery", rapporteren, bijblijven

GEGEVENS STICHTING. Postbus 256, 2170 AG SASSENHEIM RSIN nummer: KVK nummer:

Les 1: Vaktijdschriften: een eerste oriëntatie

Zoeken naar medische literatuur Marianne van der Heijden Bureau Andromeda 19 januari 2006

Auteursrecht en Open Data in de Culturele Sector

FORUM STANDAARDISATIE 22 april 2015 Agendapunt 2: Open standaarden, lijsten Stuk 2C: Advies opname SKOS op de pas toe of leg uit -lijst

NHibernate als ORM oplossing

1 Deelproject Spraakherkenning: SHoUT Audio Indexering Service

INHOUD. Wat zoek je?... 2 Waar zoek je?... 4 Hoe zoek ik?... 8 Wat heb ik? Naam. Opleiding. Project. Datum

NEN 3610 Linked Data

Tussentijds rapport Project Persistente Identificatie

LINKED DATA OVERHEID

Nieuwe uitdaging en nieuwe crowd voor VeleHanden.nl

Digiplein. DIGIPLEIN Registreren, Licentie activeren, E-boeken openen DOCENTENHANDLEIDING. 2 e DRUK. AUTEUR(S): J. van Mosseveld

Persbericht: 15 november 2017

Naar een gedistribueerd netwerk van erfgoedinformatie

Een beleidsvisie in paradoxen. Gaat het om het maken van keuzes of wordt het de kunst van continue schipperen tussen de uitersten?

Digitaal publiceren en metadata. Gerard Kuys, 13 maart 2014

Welkom & Introductie Programma

Beoordeling Stage 2 Code: ST2

SLIM 3.0. Sluit Nederland aan op Internationale Metadatastandaarden ONDERDEEL: RDA. NOTITIE 2f Work records SLIM 3.0

Inleiding. Inleiding. Impactmeting Wikimedia Commons

Notitie Doel en noodzaak conceptueel (informatie)model

Maken van een woordenboek:4 hoofdfasen

Workflow Verrijkte Documenten

Eindrapport Project Persistente Identificatie

ZieOok Gebruikershandleiding Versie 1.0

Voortgangsrapportage PRIMA! <1+80/-=(102(%!"#!$&'()%

Adlib Museum. Veelzijdig Gebruiksvriendelijk Krachtig

Transcriptie:

SVCN en het Semantische Web een eerste exploratie Guus Schreiber, VU Jacco van Ossenbruggen, CWI Overzicht Zoeken in grote virtuele webcollecties Principes van het Semantische Web Welke technieken kunnen helpen? Web demonstrator: Zoeken in een virtuele kunstcollectie Zoeken in SVCN collecties: RVM en KIT NB: werk van een paar dagen 1

Dankbetuiging MultimediaN E-Culture Project: Alia Amin, Mark van Assem, Victor de Boer, Lynda Hardman, Michiel Hildebrand, Laura Hollink, Zhisheng Huang, Marco de Niet, Borys Omelayenko, Ronny Siebes, Jos Taekema, Anna Tordai, Jan Wielemaker, Bob Wielinga http://e-culture.multimedian.nl ICN: Annemiek Teesing, Marie-France van Orsouw Rijksmuseum Amsterdam RMV en KIT medewerkers die ons geholpen hebben met de SVCN collectiedata en thesaurus Zoeken in grote virtuele webcollecties Problemen en wensen 2

Virtueel Cultuur Web 3

Zoeken in virtuele collecties Een kind zoekt naar foto s van een oranje aap Een collectie dierenfoto's bevat beelden die geannoteerd zijn met orangoetang De zoekmachine vindt deze foto s, ondanks het feit dat oranje en aap niet in de annotatie voorkomen 4

Principes van het Semantische Web 5

Principe 1: semantisch annoteren Beschrijven van webobjecten met behulp van begrippen uit gezamenlijk vocabulaire Dit is feitelijk al standaard in erfgoedcollecties! Principe 2: semantisch zoeken Zoek naar objecten die via begrippen aan elkaar gekoppeld Gebruik de begrippen om de zoekresultaten betekenisvol te groeperen aap mensaap orang-oetang oranje 6

Principe 3: de mythe van een geünificeerde thesaurus In grote virtuele collecties heb je altijd te maken met meerdere thesauri In meerdere talen Iedere thesaurus heeft haar eigen invalshoek; je kunt ze niet samenvoegen Maar je kunt de thesauri best samen gebruiken door middel van een beperkte verzameling links Het is verassend wat je met die beperkte verzameling kunt doen! Additionele bron: geografische thesauri 7

Additionele bron: lexicale thesauri Voorbeeld Tokugawa AAT stijl/periode Edo (Japanese period) Tokugawa SVCN periode Edo 8

A link tussen twee thesauri Is hier een webstandaard voor? Ja! RDF is een XML-gebaseerde webstandaard voor het beschrijven van begrippen en hun relaties Elk begrip en elke relatie hebben een webadres (URI)! auteur pers05 ISBN... 9

SKOS: een webstandaard voor de beschrijving van thesauri Vereenvoudigt het gezamenlijk gebruik Meertaligheid is een belangrijke eigenschap 10

Technieken voor het verrijken van thesauri en van annotaties Leren van links tussen thesauri Voorbeeld: leren van relaties tussen kunstenaars in ULAN en kunststijlen in AAT met behulp van kunsthistorische teksten 11

MATISSE, Henri Le Bonheur de vivre DERAIN, Andre The Turning Road Extraheren van extra kennis uit scope notes in thesauri 12

NWO programma CATCH: Continuous Access to Cultural Heritage STITCH subproject richt zich volledig op het vinden van inter-thesauri links Voorbeeld: Iconclass ARIA CHOICE: automatisch genereren van kandidaatindexeringstermen uit bijbehorende teksten (Beeld & Geluid) Ondersteuning van het indexeren van TV programma s door informatie-extractie Handmatige annotatie niet haalbaar voor grootschalige digitale archieven Context documenten zijn beschikbaar, bijv. Tv-gids informatie Doel CHOICE: genereren van kandidaatindexeringstermen Gebruik van andere bronnen naast de eigen GTAA thesaurus 13

Automatisch identificeren van kleur van objecten <Kleur> Vereist betrouwbare segmentatie <Kleur> E-Culture: een demonstrator voor virtuele erfgoedcollecties 14

16 Nov 2006 Culture Web demonstrator http://e-culture.multimedian.nl 15

16

17

Virtuele collecties moeten met grote hoeveelheden data om kunnen gaan Nieuwe zoekparadigma s: Vinden van betekenisvolle relaties tussen twee objecten/personen/.? 18

Take home message Thesaurus van zeven musea is een uitstekende basis Het nut van SVCN kan nog groter worden door haar te verbinden met andere thesauri beloning van het monnikenwerk! Belang van het gebruik van open webstandaarden en niets anders dan. 19