BIJLAGE 3. 20140217_Rapport_onderzoek_update_scenario s Rapport onderzoek update scenario s Auteur: Alina Saenko Datum: 17 februari 2014 Versie Datum Wijzigingen Auteur 0.1 05.02.2014 Klad versie Alina Saenko, Bert Lemmens 0.2 07.02.2014 Opmerkingen Alina Saenko, Bert Lemmens 0.3 12.02.2014 Update en aanpassing voorstellen Bert Lemmens 1.0 17.04.2014 Finale versie Alina Saenko 1
Inhoud Inleiding... 3 Toelichting... 4 Resultaten en voorstellen per systeem... 6 1. Adlib... 6 2. TMS... 13 3. Collective access... 19 2
Inleiding Voor het project Persistente Identificatie was het nodig om de mogelijkheden voor het uploaden van genormaliseerde data naar bestaande collectiebeheersystemen (Adlib, TMS, Collective Access) te onderzoeken. PACKED zocht in eerste instantie naar bestaande velden in de drie systemen. Indien er geen doelveld bestond, werd nagedacht over de mogelijkheid om nieuwe velden te creëren en of er een update van de systemen mogelijk is. De resultaten van dit onderzoek volgen hieronder. Voor elk systeem werden de bestaande velden en nood aan nieuwe velden in kaart gebracht. De strategie en de technische uitvoering van de update van de systemen en de upload van de genormaliseerde data zal in de volgende fase van het project verder uitgewerkt worden. 3
Toelichting De gesprekken 1 over de mogelijke update scenario s en analyse van de bestaande velden in de systemen hebben aangetoond dat in geen van de systemen specifieke velden voor de documentatie van persistente URI s bestaan. Met name voor Adlib werd onderzocht of gebruik kan gemaakt worden van bestaande velden 2. Maar uiteindelijk werd besloten om geen gebruik te maken van bestaande elementen om de volgende redenen: - De huidige catalogiseringsregels zoals die bijvoorbeeld zijn vastgelegd in het MovE invulboek, beschrijven een ander gebruik van deze elementen dan voor het documenteren van persistente URI s. Het systematisch gebruik van deze velden zou leiden tot oneigenlijk gebruik van deze elementen en voor een aantal collectie in conflict zou komen met de actuele beschrijvingsregels. - Met name de elementen voor het documenteren van identifiers worden vandaag al gebruikt en zijn essentieel voor de koppeling van de collectiebeheersystemen met de online collectiepresentatie. - Om persistente URI s op een duurzame manier te documenteren, ontbreken sowieso een aantal aanvullende velden. - Met name voor Collective Access en TMS is het technisch en beheersmatig eenvoudiger om nieuwe, specifieke elementen toe te voegen. Om uitwisselbaarheid en consistentie van de collectiedata te verzekeren wordt daarom voorgesteld om de beschrijvingselementen voor persistente URI s als volgt te implementeren: 1 Interviews met de registratoren van de partner-instellingen in de loop van november - december 2013 2 Voor de volgende bestaande velden werden overwogen of zij gebruikt kunnen worden voor het documenteren van persiste URI s object reproducties reproductie referentie object nummer/relaties digitale referenties referentie object nummer/relaties digitale referenties soort object nummer/relaties digitale referenties identifier(url) beelddocumentatie reproductiegegevens identificatie reproductie referentie beelddocumentatie reproductiegegevens identificatie soort reproductie beelddocumentatie reproductiegegevens identificatie identifier(url) 4
Persistente URI s worden gedocumenteerd in een herhaalbare groep met de volgende drie elementen: pid type Dit element legt vast welk type entiteit persistent geïdentificeerd wordt. De invoer gebeurt met behulp van een gecontroleerde termen lijst, bv.: werk, concept, agent werk pid domain Dit element legt de domeinnaam waarin de persistente URI wordt beheerd. Dit kan de domeinnaam van de instelling of van een externe autoriteit zijn. - muzee.be/collection/ - odis.be/ pid id Dit element legt het identificatienummer vast voor de betrokken entiteit A2853 Deze drie nieuwe velden zullen specifiek voor de documentatie van persistente URI s gebruikt worden. Voor de normalisering van de datering worden twee nieuwe velden aangemaakt: normalised.type Dit element legt vast welke standaard gebruikt werd om de datering te normaliseren. normalised.value Dit element legt de genormaliseerde waarde vast. ISO8601 198704/198009 5
Resultaten en voorstellen per systeem 1. Adlib (Op voorbeeld van Groeningemuseum) Gebruikte systeem: Adlib Bibliotheek+Museum 4.3 Versie 7.1, build 14008.3 (x64) In de tabel hieronder de bronvelden waaruit data werd gebruikt en de doelvelden waarin de genormaliseerde data wordt vastgelegd. In geel de velden die bijgemaakt moeten worden. Instellingen bronvelden doelvelden Erfgoedinzicht (Groeningemuseum, Mu.zee, MSK Gent, S.M.A.K.) M HKA CVG Middelheimmuseum priref institution.name object_number creator object_name production.date.start priref pid.type pid.domain pid.id thesaurus.pid.type thesaurus.pid.domein thesaurus.pid.id personeneninstellingen.pid.type personeneninstellingen.pid.domein personeneninstellingen.pid.id production.date.normalised.type 6
production.date.start.prec production.date.end production.date.end.prec production.date.normalised.value In de tabel hieronder de gedetailleerde mapping van bron naar doelveld. Entiteit bronveld ADLIB Voorbeeld waarde bronveld Open Refine veld (SPECTRUM) Voorbeeld waarde na normalisering/ve rrijking doelveld ADLIB (import) doelveld ADLIB (invoerformulier) instellingsna am voorbeeld 1 type institutionid personenenorganisaties.pid.type en: object.pid.type (niet zichtbaar) instellingsna am voorbeeld 1 domein http://groeninge museum.be/ personenenorganisaties.pid.domain objecten identificatie identificatie inste llingsnaam - domein of: http://dbpedia.or g/page/ en: object.pid.domain instellingsna am voorbeeld 1 institution.nam e Musea Brugge - Groeninge identificatie- nummer BE- B9483 personenenorganisaties.pid.id objecten identificatie identificatie inste llingsnaam - ID 7
museum of: Groeningemuseu m en: object.pid.id werk type workid object.pid.type (niet zichtbaar) werk domein http://groeninge museum.be/work /id/ of GM: object.pid.domain objecten identificatie identificatie obje ctnummer - domein werk object_number 0.2.GRO00 02.II identificatienumm er 0_2_GRO0002_II object.pid.id objecten identificatie identificatie obje ctnummer - ID beschrijving (record) type dataid object.pid.type objecten identificatie identificatie data - type beschrijving (record) domein http://groeninge museum.be/work /data/ object.pid.domein Iobjecten identificatie identificatie dat - domein 8
of GM beschrijving (record) object_number 0.2.GRO00 02.II identificatie- nummer 0_2_GRO0002_II object.pid.id objecten identificatie identificatie data - ID afbeelding type representationid object.pid.type object reproducties reproductie pid - type of: beelddocumentatie reproductiegegeven s identificatie pid - type afbeelding domein http://groeninge museum.be/work /representation/ object.pid.domein object reproducties reproductie pid - domein of GM of: beelddocumentatie reproductiegegeven s identificatie pid - domein afbeelding object_number 0.2.GRO00 02.II identificatienumm er 0_2_GRO0002_II object.pid.id object reproducties reproductie pid - id of: beelddocumentatie reproductiegegeven 9
afbeelding URL domein http://images.me morix.nl/pwv/thu mb/800x800/ object.reproduction.reference.domain s identificatie pid - id beelddocumentatie reproductiegegeven s identificatie identifier(url)- domein afbeelding reproduction.r eference - reference_num ber 69eab4bb- 7f6f- 5d2c- d7a0-84a1b8297 a38 URL identificatienumm er 69eab4bb- 7f6f- 5d2c- d7a0-84a1b8297a38 object.reproduction.reference.id beelddocumentatie reproductiegegeven s identificatie identifier(url)- id datering production.dat e.start production.dat e.start.prec production.dat e.end production.dat e.end.prec 1910 circa 1914 genormaliseerde datum 1905/1964 object.production.date.normalised.value Vervaardiging/Datering Datering Genormaliseerde datering - waarde na datering genormaliseerde datum bron iso 8601 object.production.date.normalised.type Vervaardiging/Datering Datering Genormaliseerde datering - type kunstenaar type agentid personenenorganisaties.pid.type Objecten Vervaardiging/datering Verva ardiging Vervaardiger - type 10
kunstenaar domein http://viaf.org/via f/ of viaf: en: object.pid.type personenenorganisaties.pid.domain thesaurus thesaurusterm Bron en definitie pid- type Objecten Vervaardiging/datering Verva ardiging Vervaardiger - domein en: object.pid.domain thesaurus thesaurusterm Bron en definitie pid- domein kunstenaar creator Brangwyn, Frank (Sir) identificatienumm er 54420453 personenenorganisaties.pid.id Objecten Vervaardiging/datering Verva ardiging Vervaardiger - id en: object.pid.id thesaurus thesaurusterm Bron en definitie pid- id objectnaam type objectnameid object.pid.type Objecten Identificatie Objectnaam Obj ectnaam - type en: thesaurus.pid.type thesaurus thesaurusterm Bron en definitie pid- type objectnaam domein AAT: of http://browser.aa object.pid.domain Objecten Identificatie Objectnaam Obj ectnaam- domein 11
t- ned.nl/ objectnaam object_name aquarel identificatienumm er en: thesaurus.pid.domain 300078925 object.pid.id en: thesaurus.pid.id thesaurus thesaurusterm Bron en definitie pid- domein Objecten Identificatie Objectnaam Obj ectnaam - id thesaurus thesaurusterm Bron en definitie pid- id 12
2. TMS (op voorbeeld van KMSKA) Gebruikte systeem: TMS 2012 versie 9.39.3939 In de tabel hieronder de bronvelden waaruit data werd gebruikt en de doelvelden waarin de genormaliseerde data wordt vastgelegd. In geel de velden die bijgemaakt moeten worden. bronvelden Mnemonic dbo.objects.objectnumber FileName Dated DisplayName Classification doelvelden institution.pid.type institution.pid.domein institution.pid.id dbo.objects.pid.type dbo.objects.pid.domein dbo.objects.pid.id file.pid.type file.pid.domein file.pid.id file.url.domein file.url.id normalised.date.value normalised.date.domein 13
displayname.pid.type displayname.pid.domein displayname.pid.id classification.pid.type classification.pid.domein classification.pid.id In de tabel hieronder de gedetailleerde mapping van bron naar doelveld. Entiteit bronveld TMS Voorbeeld waarde bronveld Open Refine veld (SPEC TRUM) Voorbeeld waarde na normalisering/verrijking doelveld TMS (import) doelveld TMS (invoerformulier) instellingsn aam voorbeeld 1 ID type institutionid institution.pid.type? Persistente Identificatie type instellingsn aam voorbeeld 1 ID domein http://kmska.be/ institution.pid.domein? Persistente Identificatie domein 14
instellingsn aam voorbeeld 1 Mnemonic Musea Brugge - Groeningemus eum ID BE- A4001 (ISIL code) institution.pid..id? Persistente Identificatie ID instellingsn aam voorbeeld 2 instellingsn aam voorbeeld 2 ID type 2 institutionid institution.pid.type? Persistente Identificatie type ID domein 2 http://dbpedia.org/page/ institution.pid.domein? Persistente Identificatie domein instellingsn aam voorbeeld 2 Mnemonic Musea Brugge - Groeningemus eum ID 2 Royal_Museum_of_Fine_ Arts,_Antwerp institution.pid.id? Persistente Identificatie ID werk ID type workid dbo.objects.pid.type? Persistente Identificatie type werk ID domein http://kmska.be/work/id / of KMSKA dbo.objects.pid.domein? Persistente Identificatie domein werk dbo.objects.objectn umber 1856 ID 1856 dbo.objects.pid.id? Persistente Identificatie ID 15
beschrijving (record) ID type workdataid dbo.objects.pid.type? Persistente Identificatie type beschrijving (record) ID domein http://kmska.be/work/da ta/ of KMSKA dbo.objects.pid.domein? Persistente Identificatie domein beschrijving (record) dbo.objects.objectn umber 1856 ID 1856 dbo.objects.pid.id? Persistente Identificatie ID afbeelding ID type representationid file.pid.type? Persistente Identificatie type afbeelding ID domein http://kmska.be/work/re presentation/ file.pid.domein? Persistente Identificatie domein of KMSKA afbeelding dbo.objects.objectn umber 1856 ID 1856 file.pid.id? Persistente Identificatie ID 16
afbeelding URL domein http://62.221.199.163/k mska2/zoom.aspx?image = file.url.domein? Persistente Identificatie url domein afbeelding FileName 1856.001.jpg URL id 1856.001.jpg file.url.id? Persistente Identificatie url id datering Dated 1890 genormaliseerde datum 1890 normalised.date.value? genormaliseerde datum datering genormaliseerde datum bron iso 8601 normalised.date.domein? bron kunstenaar ID type agentid displayname.pid.type? Persistente Identificatie type kunstenaar ID domein http://viaf.org/viaf/ of viaf: displayname.pid.domei n? Persistente Identificatie domein kunstenaar DisplayName James Ensor ID 88625859 displayname.pid.id? Persistente Identificatie ID objectnaam ID type termid classification.pid.type? Persistente Identificatie type 17
objectnaam ID domein AAT: of http://browser.aat- ned.nl/ classification.pid.domei n? Persistente Identificatie domein objectnaam Classification schilderij ID 300177435 classification.pid.id? Persistente Identificatie ID 18
3. Collective access (op voorbeeld van LUKAS) Gebruikte systeem: Collective Access (er bestaat de mogelijkheid om verschillende nieuwe velden aan te maken) In de tabel hieronder de bronvelden waaruit data werd gebruikt en de doelvelden waarin de genormaliseerde data wordt vastgelegd. In geel de velden die bijgemaakt moeten worden. bronvelden Gerelateerde collecties inventarisnummer (extern) inventarisnummer (extern) Object mediavoorstelling Periode (eeuw) Gerelateerde entiteit Type kunstwerk doelvelden entiteitpidtype entiteitpiddomein entiteitpidid workpidtype workpiddomein workpidid representationpidtype representationpiddomein representationpidid representationurldomein representationurlid 19
normaliseddatevalue normaliseddatedomein entiteitpidtype entiteitpiddomein entiteitpidid objectnamepidtype objectnamepiddomein objectnamepidid In de tabel hieronder de gedetailleerde mapping van bron naar doelveld. Entiteit bronveld CA Voorbe eld waarde bronvel d Open Refine veld (SPE CTRUM) Voorbeeld waarde na normalisering/verrijki ng doelveld CA (import) doelveld CA (invoerformulier) instellingsn aam ID type institutionid entiteitpidtype Entiteit Persistente Identificatie Type 20
instellingsn aam ID domein http://dbpedia.org/pa ge/ entiteitpiddomein Entiteit Persistente Identificatie Domein instellingsn aam Gerelateerde collecties SMAK ID Royal_Museum_of_Fi ne_arts,_antwerp entiteitpidid Entiteit Persistente Identificatie ID werk ID type workid workpidtype Basic Info Persistente Identificatie Type werk ID domein http://kmska.be//wor k/ of KMSKA workpiddomein Basic Info Persistente Identificatie domein werk beschrijving (record) inventarisnu mmer (extern) 2179 ID 2179 workpidid Basic Info Persistente Identificatie ID ID type workdataid workpidtype Basic Info Persistente Identificatie Type beschrijving (record) ID domein http://kmska.be//wor k/data of KMSKA workpiddomein Basic Info Persistente Identificatie domein beschrijving (record) inventarisnu mmer (extern) 2179 ID 2179 workpidid Basic Info Persistente Identificatie ID 21
afbeelding ID type representationid representationpidtype? Type afbeelding ID domein http://kmska.be//wor k/representation/ of KMSKA representationpiddomein? Domein afbeelding ID 2179 representationpidid? ID afbeelding Object mediavoorstel ling URL domein http://collectiveaccess.lukasweb.be/media/l ukas/images/ representationurldomein? url domein afbeelding Object mediavoorstel ling URL id 4/9/83142_ca_object _representations_me dia_4981_original_jpg.jpg representationurlid? url ID datering Periode (eeuw) 20 eeuwst e genormaliseerde datum 1901/2000 normaliseddatevalue Periode genormaliseerde datum datering genormaliseerde datum bron iso 8601 normaliseddatedomein Periode bron 22
kunstenaar ID type agentid entiteitpidtype Entiteit type kunstenaar ID domein http://viaf.org/viaf/ of viaf: entiteitpiddomein Entiteit domein kunstenaar Gerelateerde entiteit Constan t Permek e ID 71417899 entiteitpidid Entiteit ID objectnaam ID type termid objectnamepidtype Type kunstwerk Type objectnaam ID domein http://browser.aat- ned.nl/ of AAT objectnamepiddomein Type kunstwerk domein objectnaam Type kunstwerk schilder ij ID 300078925 objectnamepidid Type kunstwerk ID 23