Tussentijds rapport Project Persistente Identificatie

Vergelijkbare documenten
Rapport onderzoek update scenario s

Eindrapport Project Persistente Identificatie

Voorstudie CAHF-beleid omtrent digitale duurzaamheid. Bert Lemmens PACKED vzw 17 september 2013 S.M.A.K. Gent

Analyse van de beschikbare standaardterminologieën

CEST-RICHTLIJNEN INVENTARISEREN. Bert Lemmens & Henk Vanstappen (PACKED vzw)

Nr. 6, februari 2010

Tussentijds rapport Deelproject 1 Hoe word ik data uitgever? vervolgtraject Persistente Identificatie

TERf Dataprofiel voor Archeologisch Vindplaatsen

Doorlichting technische onderbouw VKC online catalogus. Bert Lemmens PACKED vzw 16 oktober 2012 KMSK Antwerpen

Duurzame koppelingen tussen kunstwerken, archieven en publicaties. 02/12/2016 Bert Lemmens Alina Saenko

De URI-strategie voor de Linked Data van de RCE. (Versie 0.2)

Deel 2: Linked Open Data via Wikidata. Barbara Dierickx, Bert Lemmens, Sandra Fauconnier

Doorlichting technisch onderbouw VKC online catalogus. Bert Lemmens PACKED vzw 7 september 2012 MSK Gent

SURFconext Cookbook. Het koppelen van Alfresco aan SURFconext. Versie: 1.0. Datum: 8 december admin@surfnet.nl

Open Data. Themamiddag Actieve Openbaarheid

Handout Workshop Open Refine

Het informatieplan: instrument voor een succesvolle omgang met je digitale. collecties en archieven. #informatieplan

TaskCentre Web Service Connector: Creëren van requests in Synergy Enterprise

Software Test Plan. Yannick Verschueren

Les 15 : updaten van gegevens in de database (deel2).

Digitale strategie voor nieuw Museum voor Edelsmeedkunst, Juwelen en Diamant Informatie aan Zee - 18/09/2015

Instructies annotatie experiment

Dataprofiel voor Artefacten

Voorstudie CAHF-beleid omtrent digitale duurzaamheid

PILNAR web applicatie. Handleiding

Informatievaardigheden Introductie EndNote

Ondersteuning van zorg gerelateerde processen en activiteiten voor patiënt en zorgverstrekkers

Modulehandleiding VivianCMS. Zoeken

GS1 Data Source. Handleiding beheer productafbeeldingen voor leveranciers en afnemers

PUBLIATO. Gebruikershandleiding van de online applicatie

ADMINISTRATIEF BEHEER DEXIASOFT

Microsoft Dynamics CRM 2011

Snel gegevens importeren en updaten met Importeren uit Excel voor SAP Business One

Software Design Document

Handleiding Study Management voor onderzoeker

AFO 139 Automatische export

2BA Deeplink Gebruiksbeschrijving

De voordelen van Drupal

Uitleg CMS Utrecht Your Way Button 1. Inloggen

Webservice voor data-uitwisseling tussen FysioRoadmap en MRS Software

SHAREPOINT ONLINE (SAMEN-)WERKEN IN DE WOLKEN. - Workshop SharePoint 1

Software Design Document

Coachview.net Eenmalige Imports

ExpressionEngine CMS. Content Management Systeem/Publicatieplatform NOAH DESIGN CREATIE & WEBDEVELOPMENT

NACSPORT TAG&GO HANDLEIDING Eigenschappen knop

Handleiding Gopress Krantenarchief

Handleiding voor Zotero versie 2.0

En hoe gaan ze dit allemaal terugvinden?

Technisch Ontwerp W e b s i t e W O S I

AUTOMATISERING. Act! WerkbonApp. De koppeling tussen het CRM systeem Act! en de Werkbon applicatie WerkbonApp.

CRVa: werk in uitvoering Samantha Castano, projectmedewerker CRVa

Boekhouding Exact Online: Koppeling gebruiken Exact Online - Koppeling gebruiken Er is een koppeling ontwikkelt om via een webservice gegevens uit te

Opdracht 1 Aanmelden. Opdracht 2a Asset beheer

Gebruikershandleiding. StUF Testplatform Versie 1.3.0

Gestructureerd registreren

Table of contents 2 / 15

FileFrame Integratie campagne management

Met deze module heeft u de mogelijkheid om gemakkelijk, snel en efficiënt uw documenten als naslag in Unit 4 Multivers te koppelen.

Mach3Framework 5.0 / Website

Technische nota AbiFire5 Rapporten maken via ODBC

Release notes Release

informatie architectuur 9 december 2010 IAM V

Met deze module heeft u de mogelijkheid om gemakkelijk, snel en efficiënt uw documenten als naslag in Unit 4 Multivers te koppelen.

v.1.9 Genkgo Handleiding Genkgo koppeling: Exact Online

Mediatheekhandleiding EndNote X9 en hoger

Technical Note. API Beschrijving Aangetekend Mailen

TranSearch WEBPlus. Overzicht

Handleiding iria. Start RIA Er zijn twee manieren om RIA te openen: ipower. iprofit MKB. iprofit (Financieel + Facturering + Relaties + Projecten)

Automatische mailing export. Automatisch exporteren van mailing rapportages uit MailPlus

Gebruikers Toevoegen. EasySecure International B.V. +31(0) Support.EasySecure.nl. v

Handleiding gebruik Citymail

1 Inleiding. 3 Handmatig... invoeren zaken basis 4 Verwerken... zaken 5 Afhandelen... van zaken. 7 Uitgebreidere... zaak opties

Base24 database suite

ALL-CRM Gebruikershandleiding AC-DataCumulator

Installatiehandleiding EndNote Hogeschool Rotterdam Mediatheek

Evenementen publiceren en bewerken

AccountView Contact Beknopte inrichtingshandleiding

Transcriptie:

BIJLAGE 2. 20140129_Tussentijds_rapport_PID_v1_1 Tussentijds rapport Project Persistente Identificatie Auteur: Alina Saenko Datum: 29 januari 2014 Versie Datum Wijzigingen Auteur 0.1 29.01.2014 Klad versie Alina Saenko 0.2 30.01.2014 Opmerkingen en verbeteringen Bert Lemmens, Rony Vissers, Joris Janssens, Alina Saenko 1.0 31.01.2014 Finale versie Alina Saenko 1.1 07.02.2014 Update resultaten analyse collectiedata Alina Saenko 1

Inhoud Inleiding... 3 1. Stand van zaken... 3 2. Resultaten... 5 Bijlage 1. Lijst van de geëxporteerde elementen... 14 2

Inleiding Dit rapport brengt verslag uit van de resultaten van de eerste fase in het project Persistente identificatie. Dit project wordt uitgevoerd in opdracht van het Departement Cultuur, Jeugd, Sport en Media van de Vlaamse overheid en ging van start op 23 september 2013. 1. Stand van zaken Eind januari 2014 worden de eerste twee fases van het project succesvol afgerond: Fase 1. Opstart (oktober - november 2013) 1.1 Werkafspraken en samenwerkingsovereenkomst - Bij aanvang van het project werd met de meeste partners samengezeten om het project toe te lichten en de eerste werkafspraken te maken. - 23.09.2013 - VKC, KMSKA, Groeningemuseum, MSKGent - 06.11.2013 - CAHF, Middelheimmuseum, Mu.Zee, M HKA, S.M.A.K. - Er werd een presentatie gegeven over het project tijdens de LUKAS Partnerdag (13.11.2013) - De nodige samenwerkingsovereenkomsten en de datagebruiksovereenkomsten zijn door alle partners goedgekeurd en ondertekend. 1.2 Onderzoek standaardterminologieën - De analyse van de standaardterminologieën die in het project gebruikt worden voor de normalisering en verrijking van de data is afgerond. De beknopte resultaten van de analyse kan men respectievelijk hieronder lezen. 1.3 Studeren data management tools - Open Refine, - Oxygen XML, - Erfgoedstats. Fase 2. Identificatie entiteiten (november 2013 - februari 2014) 2.1 Export #1 - Met enkele weken vertraging werden eind december alle exports uit de collectiebeheersystemen van de partners ontvangen (zie bijlage 1 voor de lijst van de geëxporteerde elementen). 2.2 Onderzoek update scenario s - Er werd een eerste bezoek gebracht aan de partners om de mogelijkheden voor het importeren van de verrijkte data te bespreken: 21.11.2013 S.M.A.K. 03.12.2013 - KMSKA 04.12.2013 - Middelheimmuseum 06.12.2013 M HKA 11.12.2013 - Groeningemuseum 13.12.2013 - MSKGent 19.12.2013 - Mu.Zee - Aan VKC, LUKAS en CVG dient nog een bezoek gebracht te worden. 2.3 Analyse collectiedata Per entiteit werden de volgende vragen in de analyse opgenomen en beantwoord: 3

Kunstwerk Instellingsnaam en instellingsnummer Objectnaam Vervaardiger Datering Afbeeldingen - aantal records? - wat is de syntax van de inventarisnummers? (welke logica s, welke soort tekens, welke onwenselijke leestekens?) - aantal vermeldingen in andere databanken? - hoeveel records zijn er online gepubliceerd? - aanwezig? - wat is de syntax voor instellingsnamen? - aantal records? - welke velden gebruiken de musea voor objectnamen? - aantal spellingvarianten? - is er een databanknummer voor objectnamen? - verwijzingen naar externe autoriteiten (in progress) - aantal records? - aantal spellingvarianten? - is er een databanknummer voor vervaardigers? - verwijzingen naar externe autoriteiten (in progress) - wat is de syntax voor dateringen? - welke velden worden gebruikt voor dateringen? - bestaan er afspraken voor relatieve dateringen? - aantal records? - wat is de syntax voor bestaande URI s? 2.4 Stuurgroep #1 De eerste stuurgroep van het project is gepland op 27 februari 2014. De stuurgroep bestaat uit de registratoren van de collecties, vertegenwoordigers van PACKED en vertegenwoordigers van het Departement. Op deze stuurgroep zullen de resultaten van de verschillende analyses besproken worden. Daarnaast zullen de methodes en planning voor verdere normalisering en verrijking van de data (fase 3) ter goedkeuring worden voorgelegd. Fase 3. Update collectiedata (februari- mei 2014) Deze fase zal van start gaan nadat de planning voor de normalisering en verrijking op de stuurgroep is besproken en goedgekeurd. Fase 4. Ontwikkeling demonstrator (jan- jun 2014) De software mogelijkheden voor de ontwikkeling van de twee tools (demonstrator- applicatie, Persistent URI Manager) zijn in kaart gebracht en uitgewerkt. De resultaten van dit onderzoek kan men hieronder lezen. Volgende stappen: 1. Afronden Fase 2 Identificatie entiteiten : - De eerste bijeenkomst van de stuurgroep organiseren en de verdere uitvoering van het project bespreken - In samenwerking met de collecties, leveranciers (ADLIB, TMS, CIT, PureSign) en andere betrokkenen geactualiseerde scenario s verder uittesten en uitwerken 2. Lancering Fase 3 Update collectiedata : - De methodologie van de normalisering en verrijking volledig uitwerken. De eerste tests hebben aangetoond dat er in de praktijk technische beperkingen opduiken bij het gebruik van de standaardterminologieën. Er zullen bijkomende oplossingen gevonden moeten worden (bv. een eigen reconciliation service opstellen) - De gebruiksmogelijkheden van sommige autoriteiten uitbreiden (afspraken met ODIS en RKD) 4

2. Resultaten De resultaten zijn opgesteld in de vorm van antwoorden op vragen, zoals die geformuleerd zijn in de overeenkomst tussen het Departement Cultuur, Jeugd, Sport en Media van de Vlaamse overheid en PACKED vzw: 1. Welke bestaande identifiers- verzamelingen zijn best geschikt om collectiegegevens mee te identificeren? In het kader van het Persistente identificatie project zullen de volgende standaardterminologieën toegepast worden voor de volgende entiteiten: - voor instellingen: een ISIL- code aanvragen, DBpedia, Freebase - voor objectnamen: AAT- NED - voor kunstenaars: VIAF, RKDartists&, ODIS, DBpedia, Freebase - voor datering: genormaliseerde notaties volgens ISO 8601 Hieronder volgt een overzicht van de voor- en nadelen per standaardterminologie en een voorstel voor het gebruik van standaardterminologieën in het project Persistente identificatie : INSTELLING Instellingsnamen worden genormaliseerd om collecties en kunstwerken doorzoekbaar te maken op collectiehouder. Het gebruik van een standaardterminologie moet mogelijk maken dat het ID persistent is en dat de collectiedata verrijkt kunnen worden met gegevens over de collectiehouder. Terminologie Voordelen Nadelen ISIL DBpedia - ISO- standaard, dus internationaal erkend en gebruikt - internationale code die persistentie garandeert - transparante, standaard syntax duidelijke toewijzing wie verantwoordelijk is voor de persistentie - heeft al persistente URI s voor alle musea - URI gekoppeld met uitgebreide gestructureerde informatie uit wikipedia - gemaakt als onderdeel van het belangrijkste linked data project - onderdeel van de meest gebruikte open dataset op het web - nog weinig instellingen in België die het gebruiken - instellingen die het wel hebben, weten het niet, - Belgische ISIL bestaat niet in een vorm van een link, dus kan niet verwijzen naar pagina met info over de collectiehouder - heeft geen persistente IDs voor CVG, Lukas en VKC - onduidelijk wie persistentie garandeert 5

PACKED vzw stelt twee mogelijke oplossingen voor, naargelang de prioriteit ligt bij persistentie of doorzoekbaarheid: 1. ISIL gebruiken, wanneer persistentie primeert. De beheerstructuur achter ISIL is helder, de codes worden opgesteld volgens de internationale ISO- standaard en zullen persistent blijven. De mogelijkheden voor dataverrijking zijn daarentegen beperkt. ISIL in België is geen persistente URI (geen link). Een oplossing kan zijn om als een collectiehouder zelf de persistente URI aan te maken en te beheren waarin de ISIL- code gebruikt wordt. Van de partnerinstellingen heeft enkel KMSKA een ISIL- nummer, de rest zal een nieuwe ISIL- code moeten aanvragen bij de KBR. 2. DBpedia gebruiken, wanneer verrijking primeert. Identificatie van de collectiehouder met de persistente DBpedia URI geeft toegang tot uitgebreide data die beheerd wordt op wikipedia. Er is een mogelijkheid om die data zelf aanvullen of actualiseren. Het nadeel is wel dat persistentie afhangt van de duurzaamheid van het DBpedia- project. En je hebt beperkte invloed op de online toegang tot deze data. Het is immers open data. Maar je kan onmiddellijk data verrijken. De keuze voor één van de opties, of voor beiden, zal op het stuurgroep besproken worden. OBJECTNAAM Terminologie Voordelen Nadelen AAT- Ned - standaard wordt actief en internationaal beheerd - grote hoeveelheid Nederlandstalige termen, - toegankelijk als een webservice - het toevoegen van nieuwe termen is in de praktijk nog niet heel goed uitgewerkt, het proces verloopt heel moeizaam Het vervangen van bestaande termen handmatig wordt door de medewerkers van musea als een tijdrovend proces ervaren. Door de nieuwe AAT webservice bestaan er nu mogelijkheden om deze normalisering binnen het collectiebeheersysteem te automatiseren en up- to- date te houden. Een voorwaarde voor deze normalisering en verrijking is het gebruik van de persistente identifiers die aan de termen binnen AAT- Ned waren toegevoegd. In het kader van het project zal PACKED vzw de reeds toegekende objectnamen koppelen met AAT ID s en de nog niet genormaliseerde termen eveneens van AAT ID s voorzien (men zal niet de bestaande data wijzigen, maar enkel aan de bestaande termen nieuwe ID s toevoegen). Voor de termen die met geen enkele AAT- Ned concept overeenkomen zal men een lijst aanmaken. Er zal in het kader van het project ook bekeken worden hoe deze lijst het snelst aan AAT- Ned toegevoegd kan worden. 6

VERVAARDIGER Deze terminologieën zullen in het kader van het project gebruikt worden om de collecties beter doorzoekbaar te maken op kunstenaarsnaam. Daarbij zullen de kunstenaarsnamen gelinkt worden met rijke biografische gegevens uit de standaardterminologieën over de betreffende persoon. Terminologie Voordelen Nadelen VIAF RKDartists& ODIS DBpedia Freebase - internationaal bereik - grote hoeveelheid kunstenaarsnamen - heeft een groot aantal andere autoriteiten al in zich opgenomen, - toegankelijk in verschillende formaten, en zowel via API als download - open data - specifiek voor kunstenaarsnamen - rijke contextuele data - veel kunstenaarsnamen van de NL/VL regio - databank is gericht op Vlaamse en Belgische intermediaire structuren - heel rijke metadata en verwijzingen naar andere bronnen (m.n. archieven) - grootschalige database - technisch toegankelijk op vele verschillende manieren - grootschalige database - technisch toegankelijk op vele verschillende manieren - is eigenlijk een bibliotheekindex (auteurs) - niet gemakkelijk om een nieuwe term toe te voegen, toevoegen kan enkel via grote organisatie. - in de praktijk: enkele beperkingen tijdens het gebruik van API (beperkt aantal vragen, vooral voor grote opdrachten) - lokaal bereik: vermoedelijk weinig resultaat voor lokaal bekende kunstenaars - momenteel enkel toegankelijk als een online zoekdatabase, geen API - geen mogelijkheid om termen toe te voegen, toevoegen kan enkel via RKD- redacteurs (intern) - geen duidelijke informatie over de licentie NB: binnenkort komen er wel verbeteringen i.v.m. de toegankelijkheid en de mogelijkheid om termen toe te voegen - voor niet- partners enkel als een online database met zoekopdrachten toegankelijk - slechts 42% van de informatie online toegankelijk - voor niet- partners geen mogelijkheid om termen toe te voegen NB: Samen met ODIS is PACKED hiervoor een oplossing aan het zoeken - in de praktijk enkele technische beperkingen bij het gebruik (vooral voor grote zoekopdrachten) - termen toevoegen enkel via andere autoriteiten zoals Wikipedia of VIAF - in de praktijk enkele technische beperkingen bij het gebruik (vooral voor grote opdrachten); 7

Elke terminologie heeft zijn eigen inhoudelijke bereik die onvolledig kan zijn voor de materie die in dit project genormaliseerd en verrijkt dient te worden. Het gebruik van verschillende standaardterminologieën samen verhoogt de kans om de string waarden via een externe identifier te kunnen identificeren. PACKED vzw stelt voor om vervaardigers persistent te identificeren met behulp van drie complementaire standaardterminologieën: VIAF, RKDartists& en ODIS. VIAF is het grootste databank, maar er is een significant risico dat lokale Vlaamse kunstenaars niet in de databank voorkomen. Dit kan opgevangen worden door het gebruik van RKDartists& en ODIS die gericht zijn op Nederlandse en Vlaamse personen en organisaties. Beide terminologieën zijn echter niet toegankelijk via een webservice, waardoor semi- automatische normalisering complexer is dan met behulp van VIAF. Daarnaast zijn beide terminologieën niet beschikbaar voor verrijking onder een open data licentie zoals VIAF. PACKED vzw zal in de volgende maanden gesprekken voeren met RKD en ODIS over de technische en legale voorwaarden voor het gebruik van beide terminologieën in het project. Freebase en DBpedia zullen gebruikt worden voor de termen die niet voorkomen in VIAF, ODIS of RKD. DATERING De terminologie voor dateringen zal in het kader van het project gebruikt worden om de collecties beter doorzoekbaar te maken op datum en om een chronologische visualisering van de kunstwerken mogelijk te maken. Terminologie Voordelen Nadelen ISO 8601 - duidelijk en machineleesbaar, wat doorzoekbaarheid verhoogt - wijdverspreide webstandaard voor dateringen - nood aan interne afspraken i.v.m. de interpretatie van precisie - De terminologie aanvaardt enkel preciesie tijdsperiodes. Open tijdsbepalingen zoals een terminus post/ante quem kunnen niet gecodeerd worden. Voor het project stelt PACKED vzw een specifieke toepassing van de ISO 8601 standaard voor. Dit voorstel is bedoeld voor de notaties van de genormaliseerde data, die naast de dateringvelden in het collectiebeheersysteem zullen opgenomen worden. De genormaliseerde dateringen worden gebruikt voor de zoekindex. De data in de dateringsvelden worden gebruikt voor presentatie in de zoekresultaten. De projectpartners dienen echter een consensus te bereiken over de manier waarop open tijdsbepalingen omgezet worden in tijdsperiodes. Het volgende voorstel houdt rekening met de bestaande praktijken binnen de partnerorganisaties voor de bepaling van de datering van kunstwerken en vertaalt deze naar de machineleesbare ISO 8601 genormaliseerde dateringen. Begrippen zoals bv. ca, voor en na dient best volgens een afspraak te worden geïnterpreteerd, maar kan van collectie tot collectie variëren. Datering van en precisie Datering tot en precisie ISO- genormaliseerde datum Commentaar 1567 1598 1567/1598 8

1567-1567 - 1598? te bespreken in de stuurgroep voor 1567-1517 1567 min 50 jaar na 1567-1617 1567 plus 50 jaar ca 1567-1562/1572 1567 min 5 jaar / 1567 plus 5 jaar ca 1567 ca 1598 1562/1603 1567 min 5 jaar / 1598 plus 5 jaar ongeveer 1567 1565/1569 1567 min 2 jaar / 1598 plus 2 jaar 19de eeuw 1801/1900 begin 19de eeuw 1801/1825 midden 19de eeuw 1826/1875 einde 19de eeuw 1876/1900 jaren 90g 19de eeuw 1890-01- 01/1899-12- 31 Indien er herhaalbare dateringen zijn (bv. meerdere datering van bekend) dienen er meerdere velden voor de genormaliseerde ISO- datering te worden gecreëerd. 2. Hoe zullen er de PIDs uitzien? Op de eerste bijeenkomst van de stuurgroep wordt de volgende standaardnotatie van de persistente URI ter goedkeuring voorgelegd: http://[domein]/[type object]/[type document]/[identificatienummer] Deze URI bestaat uit de volgende elementen: domein - de naam van de server type object - archiefstuk, boek, schilderij, persoon type document - beschrijving, afbeelding identificatienummer - unieke registratienummer Hierbij zijn [domein] en [identificatienummer] verplicht te gebruiken en [type object] en [type document] facultatief. Voorbeeld: http://www.kmska.be/work/data/a_5943 Tijdens de eerste gesprekken met de partners werd ook overlegd welke domeinnaam de verschillende organisaties gaan gebruiken: VKC http://vlaamsekunstcollectie.be/ 9

Groeningemuseum KMSKA MSKGent LUKAS S.M.A.K. M HKA Middelheimmuseum Mu.Zee CVG http://groeningemuseum.be/ http://kmska.be/ http://mskgent.be/collection/ http://lukasweb.be/ http://smak.be/collection/ http://mukha.be/ http://stadantwerpen.be/middelheimmuseum/ of http://middelheimmuseum.be/ http://muzee.be/collection/ http://kunstenenerfgoed.be/cvg/ PACKED vzw wil alle partnerinstellingen aanraden om steeds hetzelfde principe te gebruiken: http://instelling/collection/work/data/id. Dit voorstel zal verder besproken worden op de eerste bijeenkomst van de stuurgroep. 3. Hoe kunnen records met betrekking tot kunstenaars of concepten uit de negen collecties toegevoegd worden aan bestaande verzamelingen identifiers (VIAF, RKDArtist, DBpedia..) wanneer ze hierin nog niet voorkomen? Deze vraag is per standaardterminologie onderzocht: ISIL- code AAT- Ned In België is het mogelijk om een ISIL- code via een online procedure op de website van de Koninklijke Bibliotheek aan te vragen en op die manier de gegevens over de instelling toe te voegen aan bestaande lijst. Na bevestiging ontvangt de aangevraagde instelling een ISIL- code per e- mail. In Nederland en België is Bureau AAT verantwoordelijk voor de beschikbaarstelling van de AAT- Ned. De medewerkers van Bureau AAT voeren, in samenspraak met deskundigen, verbeteringen door aan de data en behandelen nieuwe termvoorstellen. Nieuwe termvoorstellen worden voorlopig verzameld en behandeld door redactieraad met leden uit Vlaanderen en Nederland. De gebruikers kunnen zelf aanvullingen of verbeteringen voorstellen, maar ze dienen wel aan een aantal redactionele en inhoudelijke voorwaarden te voldoen. Het kan op de volgende manieren gebeuren: 1. Op de lokale niveau kan de nieuwe term gekoppeld te worden aan de hiërarchische structuur van de AAT. Er dient dus een meer algemene term 10

(een broader term) gekozen te worden, waar de nieuwe term qua betekenis onder valt. In de thesaurusmodule van een bestaande registratiesysteem wordt er dan een specifieke, nieuwe term als narrower term toegevoegd. Op deze manier maakt men gebruik van de hiërarchische structuur van een internationale standaard (de AAT) en past men een nog verdere verfijning toe binnen de eigen organisatie. In dit geval is het niet echt een voorwaarde om nieuwe concepten voor te stellen omdat het volstaat om een link naar de broader term te leggen. 2. Via de website (http://browser.aat- ned.nl/) kunnen aanvullingen worden voorgesteld: bij ieder concept bevindt zich een knop 'bewerken' of 'term voorstellen' waarna de opmerkingen via een formulier aan Bureau AAT doorgegeven kunnen worden. Opmerkingen kunnen ook voor andere gebruikers zichtbaar worden gemaakt. De voorstellen moeten voldoen aan de regels voor opname in de thesaurus. Er dienen bepaalde velden worden ingevuld bij een voorstel van een nieuwe term. Voor de opname van een term in de Engelstalige AAT is de volgende informatie nog nodig: Engelse vertaling van het Nederlandstalige concept, Engelse bron(nen) gebruikt voor de vertaling, Engelse vertaling van de scope note (met bronvermelding). Hoewel de procedure bestaat, is er tot nu toe nog geen enkele nieuwe Nederlandse term in de AAT- NED opgenomen. De procedure blijkt in de praktijk te lang te duren en men is gebonden aan Getty zelf. VIAF Indien een instelling haar data wil leveren aan VIAF, is dat mogelijk via een online aanvraag. De OCLC zal eerst een analyse maken van het door de instelling aangeleverde testbestand met de data en die proberen te linken aan VIAF- database. Na een succesvolle testfase word er een contract afgesloten tussen de instelling en VIAF, en kan een volledig authority bestand worden doorgestuurd naar VIAF. Er zal van de instelling verwacht worden dat ze systematisch updates van de data doorstuurt naar VIAF. RKDartists& ODIS DBpedia Freebase Het toevoegen van nieuwe kunstenaarsrecords is nog niet voorzien. In de nieuwe interface RKDexplore komt er per kunstenaarskaart een mogelijkheid voor bezoekers van de site om reactie / aanvullende informatie over de kunstenaar toe te voegen. RKD heeft al concrete plannen om de database op een gecontroleerde wijze voor externe invoer open te stellen. De informatie binnen de ODIS- databank wordt enkel door de partners aangevuld, geactualiseerd en met elkaar verbonden. In de DBpedia wordt enkel de informatie opgenomen die op Wikipedia werd gepubliceerd. Indien er niet alle feiten uit Wikipedia naar DBpedia werden overgenomen, kan men dat aangeven of zelf een nieuwe gestructureerde exctractie creëren via DBpedia Extraction Framework. Data kan naar Freebase geïmporteerd worden via Freebase Import. De ingevoerde en in Freebase toegankelijk gemaakte data dient wel aan de Terms 11

of Service voldoen: 1. De content dient via de volgende licenties beschikbaar te worden gesteld op Freebase: - voor inhoudelijke data (gegevens, schema s, beschrijvingen): de CC- BY licentie; - voor beeldmateriaal: GFDL, Public Domain, Fair Use ; - voor code: compatibel met de BSD- licentie. 2. Google en anderen verkrijgen toegang tot de gepubliceerde informatie onder de licentie CC- BY, wat ook betekent dat de verwijzingsvereisten van Freebase van toepassing zijn. Wanneer een objectnaam niet gelinkt kan worden aan een concept uit de standaardterminologie stelt PACKED vzw voor om in dit project een nieuwe URI te maken met de domeinnaam van het instelling en de string waarde van de term. Voorbeeld voor steelpan kan het de volgende URI worden: http://groeningemuseum.be/collection/concept/id/steelpan Deze URI s kunnen makkelijk afgezonderd worden en dienen op termijn vervangen te worden door een term uit de standaardterminologie, bijvoorbeeld door de term toe te voegen aan de standaardterminologie. 4. Aan hoeveel (en welke) (meta)data PIDs dienen te worden toegekend? Hieronder een overzicht van elementen per collectie (met vermelding van de hoeveelheid):aan welke nieuwe persistente URI s zullen worden toegekend in de loop van het project Kunstwerk Objectnaam Vervaardiger Datering van en tot Afbeelding Groeningemuseum 6.069 56 1.528 9.300 4.477 SMAK 4.639 33 1.235 3.436 0 MuHKA 3.741 283 986 3.485 6.646 Middelheim 1.248 46 670 2.103 1.522 Mu.Zee 4.602 216 769 3.673 3.298 MSKGent 7.478 116 1.637 4.332 5.135 KMSKA 7.852 21 1.467 3.465 7.305 VKC 2.533 4 401 2.111 2.380 CVG 1.097 92 418 1.558 837 LUKAS 3.734 67 1.583 8 6.573 Totaal 42.993 934 10.694 33.471 38.173 12

Op die manier zullen er in totaal 92.794 nieuwe persistente URI s aangemaakt (voor kunstwerken, objectnamen, vervaardigers en afbeeldingen), 33.471 dateringen genormaliseerd en 10 nieuwe ISIL- instellingsnummers (per collectie) aangemaakt. 5. Welke software zal worden gebruikt voor de creatie van de demonstrator? 1. Demonstrator- applicatie Er zal gebruik gemaakt worden van Symfony2, een framework voor de PHP- programmeertaal. Een framework zoals Symfony2 gebruiken, heeft als voordeel dat verschillende functionaliteiten niet meer van nul gebouwd moeten worden, maar reeds beschikbaar zijn als configureerbare bundles. Bundles zijn modules die een bepaalde functionaliteit vervullen, bijvoorbeeld: gebruikersbeheer, koppeling met een indexing/search engine zoals Lucene,. Het project zal zich voornamelijk concentreren op het schrijven van de code om de verschillende componenten aan elkaar te lijmen. Deze code zal, in overeenstemming met de samenwerkingsovereenkomst, vrijgegeven worden onder een zo open mogelijke licentie. Voor het indexeren van de data zal er gebruik gemaakt worden van Apache Solr. Solr maakt onder de motorkap gebruik van Apache Lucene, de meest populaire search/indexing engine van het moment. Solr laat via een eenvoudige API andere programma s gebruik laat maken van de indexeer- en zoekmogelijkheden die Lucene biedt. 2. Persistent URI Manager De Persistent URI Manager wordt gebruikt voor twee taken. 1) Het beheer van persistente URIs 2) Het doorverwijzen van een persistente URI naar de werkelijke URL. Voor beide componenten maken we opnieuw gebruik van het PHP- framework Symfony2. Het Symfony2 framework biedt een eenvoudige manier om met databanken te interageren en legt een standaard werkmethode op die ontwikkelaars toelaat om de software eenvoudig door te ontwikkelen. Symfony2 is open source software en uitgebreid gedocumenteerd, vermits het één van de meest populaire PHP- frameworks is. Voor het resolven van de persistente URIs zullen we zo efficiënt gebruik mogelijk gebruik maken van het HTTP- protocol. Symfony2 beschikt over enkele zeer uitgebreide componenten die instaan voor het afhandelen van HTTP- requests. Verder zitten er componenten in Symfony2 ingebakken die de vertaalslag van de persistent URI naar de werkelijke URL vereenvoudigen. 13

Bijlage 1. Lijst van de geëxporteerde elementen De volgende beschrijvingselementen werden telkens voor de volledige collectiedata als een export in de vorm van een XML- bestand aan PACKED vzw aangeleverd: Per record: instellingsnaam naam van de collectiebeherende instelling die het kunstwerk beheert adlib:institution databanknummer inventarisnummer titel vervaardiger databanknummer vervaardiger (indien aanwezig) datering van / datering tot het identificatienummer van het record met de beschrijving van een kunstwerk in de collectiedatabank het inventarisnummer van het kunstwerk de titel van het kunstwerk de naam/namen van de vervaardiger(s) van het kunstwerk het identificatienummer van de vervaardiger(s) in de collectiedatabank de datering van het kunstwerk, inclusief van/tot, precisie, vrije tekst adlib:priref tms:dbo.objects.objectnumber object_number object.number tms:dbo.objects.objectid adlib:title tms:select TOP (100) PERCENT ObjectID, Title, DisplayOrder FROM dbo.objtitles AS OT WHERE (Displayed = 1) AND (Active = 1) AND (LanguageID = 1) AND (DisplayOrder = 1) ORDER BY ObjectID adlib:creator tms:dbo.displayconstituents.firstname AS voornaam, dbo.displayconstituents.middlename AS tussenvoegsel, dbo.displayconstituents.lastname AS achternaam adlib:production.date.start adlib:production.date.end adlib:date_early date_early_precision adlib:date_late date_late_precision 14

objectnaam databanknummer objectnaam (indien aanwezig) link naar de webpagina link naar de afbeelding de objectnaam/namen voor het kunstwerk het identificatienummer van de objectnaam in de collectiedatabank een bestaande URL voor een webpagina met de beschrijving van het kunstwerk, bijvoorbeeld op de collectiewebsite of in een erfgoedportaal, of een omschrijving van de syntaxis van die URL en het identificatienummer dat in de URL wordt gebruikt een bestaande URL voor een referentieafbeelding van het kunstwerk, bijvoorbeeld op de collectiewebsite of in een beeldbank, of een omschrijving van de syntaxis van die URL en het identificatienummer dat in de URL wordt gebruikt tms:dbo.displayconstituents.displaydate adlib:object_name tms:dbo.classifications.classification adlib:image_reference adlib:reproduction.reference adlib:reproduction.reference.url 15