Vocabulaire en Alignment Service



Vergelijkbare documenten
OpenSKOS / VocabulaireBank

CATCHPlus gemeenschappelijke diensten

D V1 van de browse en zoek applicatie

De kracht van genetwerkte terminologiebronnen: CATCHPlus en de Cultural Commonwealth Johan Oomen en Hennie Brugman

Stappenplan Linked (Open) Data voor Archieven

Paul Doorenbosch STITCHplus - gebruikerscommissie. Den Haag, Catchplus gebruikerscommissie

1 Deelproject Spraakherkenning: SHoUT Audio Indexering Service

Doel is, dat dit document uiteindelijk een visie formuleert, waar de volgende partijen achter kunnen staan:

Erfgoedinformatie beter vindbaar maken

BIJLAGE _functionele_eisen_demonstrator. 1. Opzet project, databank instantie, serverconfiguratie, NoSQL database

Digitaal Erfgoed: Ontsluiting en semantisch beheer. Netwerk Digitaal Erfgoed

Linked Data: stap voor stap, deel 4 Table of Contents

SVCN en het Semantische Web een eerste exploratie

GeoKey en Catalog Services

NBC+ Collecties beter vindbaar maken Deel 2. Enno Meijers 30 september 2014

Choral + Spraaktechnologie: ingezet voor de ontsluiting van audiovisuele

CatchPlus Workspaces. Patricia Alkhoven. CatchPlus. Gert-Jan van Dijk. Target Media BV. Datum: 27 april Versie: 1.0

Op weg naar de Digitale Collectie Nederland 30 september Pieter Vijn Beeld& Geluid

Erfgoed & Locatie Pilot 1: Infrastructuur [WP-04] Pilotprojectplan versie 2.2 p. 1/5

, 2018 Martien Vos. Presentatie RedForce

Technologieverkenning

De URI-strategie voor de Linked Data van de RCE. (Versie 0.2)

Semantische technieken, cultureel erfgoed en gebruikers

Plan van aanpak Register

Linked Open Data en EDM. Jacco van Ossenbruggen Centrum Wiskunde & Informatica (CWI) Vrije Universiteit Amsterdam

Conceptenbibliotheek & Technisch register. Frank Terpstra

Verkenning adoptie W3C rdf/owl technologie voor IMxx/NEN modellen

Lancering van de DERA

Data, tools en infrastructuren Rollen en verantwoordelijkheden

Workshop Metadata, Ontologieën en het Semantische Web

Digitale strategie voor nieuw Museum voor Edelsmeedkunst, Juwelen en Diamant Informatie aan Zee - 18/09/2015

Wat kan linked data betekenen voor de Basisregistratie Grootschalige Topografie?

CEST-RICHTLIJNEN INVENTARISEREN. Bert Lemmens & Henk Vanstappen (PACKED vzw)

Catalogus Omgevingswet PLDN 18 april 2017 Peter Stolk projectmanager Kadaster

Uw data op het Web van Data

Plan van Aanpak voor Linked Open Data en PID bij de bron

Modelconvenant toetreding tot de ERFGOEDSUITE

Samengaan van Geo-informatie en Service Oriëntatie

Nr. 6, februari 2010

Een moderne dienstverlening voor musea en erfgoedinstellingen

Voortgangsrapportage PRIMA! <1+80/-=(102(%!"#!$&'()%

CATCHPlus verslag 2011

Tilburg, 13 september Stand van zaken en nieuwe ontwikkelingen

Linked Open Data pilot. Reijer Copier

Project APEx Archives Portal Europe network of excellence

Lokale besluiten als gelinkte Open Data #LBLOD

PROJECT PERSISTENTE IDENTIFICATIE. Alina Saenko, Bert Lemmens, Joris Janssens

Plone user case:

Nummer VGA Datum versie: 0.5

Oracle Application Server Portal Oracle Gebruikersgroep Holland Oktober 2003

Base24 database suite

Stel je een wereld voor waarin elke persoon vrije toegang heeft tot alle kennis. Dat is waar wij aan werken. Jose Spierts april 2010

Ministerie van Onderwijs, Cultuur en Wetenschap. Blockchainpilot. Gedistribueerd netwerk van erfgoedinformatie

APEX en JasperReports

Jaar: Titel: Continuous Access to Cultural Heritage Plus. Projectplan voor PRIMA-projecten

Standaard-URI's naar Jurisprudentie met behulp van de European Case Law Identifier (ECLI)

Specificaties Front End voor de ONBETWIST Database

Les 10 : Aanmaken van een database (deel2).

Kadaster Data Platform

Spatial Metadata & Opensource Geo Software. Paul van Genuchten OSGeo.nl dag Velp

CATCHPlus verslag 1 ste halfjaar 2011

Loca%e & Erfgoed Aggrega%edag 5 juni

Workshop 12 ART-DECOR en Acute overdracht. Michael Tan Kai Heitmann Maarten Ligtvoet

Brussel, TiNT 2015 Jef Malliet

Inleiding. Inleiding. Impactmeting Wikimedia Commons

Aansluiten op Geopunt: beter te vinden, te bekijken en te downloaden

Data, Data, Data: Big, Linked & Open

Data, Data, Data: Big, Linked & Open

RESEARCH DATA MANAGEMENT INNOVATIE & SURF

NOiV jaarcongres maart Flamingo. de weg naar versie 4 een kwestie van durven?

OSLO Open Standaarden voor Lokale Overheden

ZOEKEN IN BUSINESS SOURCE PREMIER

Rotterdamse TerugMeld Faciliteit

Update NBC+ Mark Knijnenburg. 11 september 2014

Haza-21 Handleiding Thesaurus

Geo-data als onderdeel van het eco-systeem van het web. Marcel Reuvers 2 september 2015

..over. Geoportalen. en: Interoperabiliteit, Open Standaarden en WebService Architecturen. Presentatie GIN 17 november 2004 Theo Thewessen Geodan IT

Handboek)voor)een)Data)uitgever)

januari TTNWW Handleiding TST tools voor het Nederlands als Web services in een Workflow Meertens Instituut, Joan Muyskensweg 25, 1096 CJ Amsterdam

Handout Workshop Open Refine

Waarom automatiseren?

ZieOok Gebruikershandleiding Versie 1.0

Linked data als klittenband voor de Basisregistraties en meer!

Informatievaardigheden Introductie EndNote

CLARIN-NL Metadataproject

OP EN IN HET WEB. Hoe de toegankelijkheid van juridische informatie kan worden verbeterd

STAFF PUBLICATIONS GRAPHIC OVERVIEW BROWSE OMGEVING, PUBLICATIELIJST EN VERFIJNING OP FACETTEN... 3

BNL update - 25 september 2013 Winkel van Sinkel, Utrecht. Ontwikkelingen NBC+ Sander van Kempen, Content Manager BNL

OAS en het Kennisplatform API s. Dimitri van Hees

Projectplan De ijsberg zichtbaar maken

WORKSHOP #2 HOE WORD IK DATA UITGEVER? Alina Saenko & Bert Lemmens FARO, Brussel

FS B. FORUM STANDAARDISATIE 16 december 2014 Agendapunt 5. Open standaarden, lijsten Stuknummer 5B. Intake-advies SKOS.

Delft-FEWS, HYMOS & MATROOS Gebruikersdag 2011 dagvoorzitter: Marc van Dijk

Maximizer CRM Simply Successful CRM

RESEARCH DATA MANAGEMENT & ACCESS OP RESEARCH WORKSPACES

Wikimediaplatformen: Wat? Waarom? Hoe? Hergebruik van data uit erfgoeddatabanken. PACKED / VIAA Sam Donvil

Geodata: registreren, ontsluiten, archiveren

DEN Collecties en Open Archives Initiative

Virtual Research Environment van concept richting oplossingen

Transcriptie:

Vocabulaire en Alignment Service Hennie Brugman Technisch coordinator CATCHPlus Max-Planck-Institute for Psycholinguistics Nederlands Instituut voor Beeld en Geluid

Overview CATCH en CATCHPlus Bijdrage aan infrastructuur voor digitaal erfgoed Vocabulary and Alignment Service doelen en gebruiksmogelijkheden Wat hebben we al gebouwd? Architectuur Functionaliteit Voorbeelden Demos Status en beschikbaarheid Toekomstperspectief Conclusies en opmerkingen

Rijksmuseum Amsterdam Nationaal Archief Koninklijke Bibliotheek Beeld en Geluid Gemeentemuseum Den Haag CATCH & CATCHPlus Gemeentearchief Rotterdam CATCH onderzoeksprogramma (NWO - 14 projecten) NCB-Naturalis CATCHPlus valorisatie-project 8 subprojecten bij grote erfgoedinstellingen Levert (her)bruikbare tools en diensten Verbonden door gemeenschappelijke diensten mbt terminologie annotaties metadata (catalogus-informatie) content CATCHPlus project bureau gehuisvest bij het Nederlands Instituut voor Beeld en Geluid (Hilversum) www.catchplus.nl Rijksdienst voor het Cultureel Erfgoed

CATCHPlus en infrastructuur voor digitaal erfgoed

User Profile Repository Annotations Vocabularies Identity services user id Workspace services Index text services recomm. srvs handwriting srvs speech services music services Content Content Catalog Catalog (metadata) Catalog (metadata) (metadata) Persistent Identifier services

User Profile Repository Annotations Vocabularies Identity services user id Workspace services Index text services recomm. srvs handwriting srvs speech services music services Status Content Content Catalog Catalog (metadata) Catalog (metadata) (metadata) Persistent Identifier services

Vocabulary and Alignment Service doelen en gebruiksmogelijkheden

Belangrijke VAS doelen Standaard formaat SKOS Web publicatie van vocabulaires Als doorzoekbare en browse-bare dataset (mbv REST API) Als Linked Open Data Bruikbaar voor duurzame referenties naar concepten persistent identifiers Verbeterde semantische interoperabiliteit door het ondersteunen van alignments Ontkoppelen thesaurus-aanbod en thesaurus-gebruik Mogelijk regeling van licenties per community

Belangrijke VAS doelen Standaard formaat SKOS Web publicatie van vocabulaires Als doorzoekbare en browse-bare dataset (mbv REST API) Als Linked Open Data Bruikbaar voor duurzame referenties naar concepten Persistent Identifiers Verbeterde semantische interoperabiliteit door het ondersteunen van alignments Ontkoppelen thesaurus-aanbod en thesaurus-gebruik Mogelijk regeling van licenties per community

SKOS Term: Economic cooperation Used For: Economic co-operation Broader terms: Economic policy Narrower terms: Economic integration, European economic cooperation, European industrial cooperation, Industrial cooperation Related terms: Interdependence Scope Note: Includes cooperative measures in banking, trade, industry etc., between and among countries.

SKOS Term: Economic cooperation Used For: Economic co-operation Broader terms: Economic policy Narrower terms: Economic integration, European economic cooperation, European industrial cooperation, Industrial cooperation Related terms: Interdependence Scope Note: Includes cooperative measures in banking, trade, industry etc., between and among countries.

Linked Open Data Een methode om data te tonen, delen en verbinden via dereferencable URIs op het Web. Principes (naar Tim Berners-Lee) Gebruik URIs om dingen te identificeren. Gebruik HTTP URIs zodat er naar deze dingen kan worden verwezen en dat ze kunnen worden opgezocht ( dereference ) door mensen en computer-programma s. Geef nuttige informatie over het ding als zijn URI wordt gedereferenced, met gebruikmaking van standaarden als RDF- XML. Neem links naar andere, gerelateerde, open data op om het ontdekken van gerelateerde informatie op het web te verbeteren.

Linked Open Data

Persistent Identifiers voor concepten Stabiele URIs per concept Bv http://data.beeldengeluid.nl/gtaa/28181 PID per Concept Scheme (subthesaurus) 10574/<cs_identifier> Concepten mbv templates 10574/<cs_identifier>-28181 Primair te koppelen aan stabiele URL

Use cases Use cases uit CATCHPlus en Cultureel Erfgoed Publiceer je thesaurus: importeer een SKOS vocabulaire, dan krijg je er REST toegang, tool support en Linked Data gratis bij Selecteer het juiste concept om een object te beschrijven Gebruik voor browsen en zoeken (naar terminologie en/of collectie-data) VAS repository als een topic map voor erfgoed-collecties Thesaurus-onderhouds-taken door online gemeenschappen Vertalen, verfijnen, generaliseren van zoekvragen Etc.

Wat hebben we tot nu toe gebouwd? Architectuur, functionaliteit, voorbeelden en demo s

Architectuur Repository voor SKOS data (inclusief alignment data) RDF store (Virtuoso) REST API (search, autocomplete, upload, download) Linked Data interface REST API LoD RDF Store

REST functionaliteit API basis functies /find/concept /find/conceptscheme /find/conceptschemegroup /find/relation http://catchplus.tuxic.nl/catchplus/serviceapi/1/

REST voorbeelden (alle gtaa onderwerpen met preflabel beginnend met al ) http://catchplus.tuxic.nl:18080/vas/api /find/concept? format=xml& query=^al& match_kind=regex& limit=100& cs=http://www.beeldengeluid.nl/thesaurus/onderwerpen &sort=match_label& match_language=nl

REST voorbeelden http://catchplus.tuxic.nl:18080/vas/api/find/concept?format=xml&qu ery=^al&match_kind=regex&limit=100&format=xml&cs=http%3a%2 F%2Fwww.beeldengeluid.nl%2FThesaurus%2FOnderwerpen&sort =match_label&match_language=nl http://catchplus.tuxic.nl:18080/vas/api/find/concept?format=xml&uri =http%3a%2f%2fwww.beeldengeluid.nl%2fthesaurus%2f28181 &info=skos_concept http://catchplus.tuxic.nl:18080/vas/api/find/concept?format=json&uri =http%3a%2f%2fwww.beeldengeluid.nl%2fthesaurus%2f28181 &info=skos_concept

LoD demo (werk in uitvoering) http://linkeddata.uriburner.com/ode

Client tools en diensten (via de REST API) CATCHPlus cases (semantische annotatie, term ranking, art recommender, ) Commerciële collectie-beheer software bouwer gebruikt de API om thesaurus informatie te integreren Generieke browse en zoek webapplicatie

http://vocrep.q42.net/index.html

VAS SKOS guidelines SKOS, plus ConceptSchemeGroups Laden/verwijderen gaat momenteel per CSG Concept counts, firstlanguage expliciet aan te geven Conventies voor labels van concepten, csg en cs Skos mapping, owl:sameas, alignapi alignments voor het representeren van alignment data Expliciet definiëren van top concepten voor concept schemes

Status en beschikbaarheid Bevat momenteel 12 thesauri (meestal is de licentie-situatie niet geregeld) Browse/search tool (versie 2) is klaar Steeds bredere belangstelling van Thesaurus aanbieders VU, Wageningen SemWeb group, RKD, CLARIN-NL Tool bouwers Collectie-beheer software bouwers Biedt een kans op harmonisatie van de API en/of de technologie Gebruikt voor samenwerking tussen Beeld en Geluid en Nationaal Archief mbt de GTAA thesaurus Doorontwikkeling via Open source model

Toekomst Gedistribueerde operatie live verbindingen met thesaurus databases automatische updates Linken met DEN inventarisatie van terminologiebronnen

CATCHPlus Browse/Search Commercial Tools and Services Linked Data tools REST API LoD upload/harvest RDF Store REST API LoD REST API LoD REST API RDF Store RDF Store Alternative Store

Conclusies en opmerkingen Doorontwikkeling is nodig voor een langdurig beschikbare oplossing. Open source model, met bijdragen door diverse stakeholders. De/een API is essentieel. Minimaal is API harmonisatie tussen de diverse thesaurus-aanbieders en toolbouwers noodzakelijk. Hosting gebeurt momenteel via CATCHPlus, dus tijdelijk. Een meer duurzame hosting-oplossing moet nog gerealiseerd worden. De licentie-problematiek is nog grotendeels onopgelost. Promoten van ODbL (Open Database Licence) is zeer wenselijk.

Dank u. Vragen?