Vergelijkbare documenten
TS > MMXII # 32. Afb. 1: vensterstructuur MAXqda VENSTERSTRUCTUUR

A. Wat zijn digitale afbeeldingen? B. Bitonaal, grijswaarden of kleur en de bitdiepte C. Resolutie, bestandsgrootte, compressie en bestandsformaten

Choral + Spraaktechnologie: ingezet voor de ontsluiting van audiovisuele

Open Data. Themamiddag Actieve Openbaarheid

Helemaal Digitaal. Tips voor een beter beheer van je digitaal archief

Cijferboek cultureel erfgoed algemeen rapportageverslag

Cijferboek cultureel erfgoed algemeen rapportageverslag

Cijferboek cultureel erfgoed algemeen rapportageverslag

Belééf het Erfgoed. Modules. Framework. Diensten. Portaalsoftware

Eindformaat = 210x150mm

Handreiking Vervanging Archiefbescheiden Werkboek

Documenten scannen met OCR

Beeldende kunst archieven RKD / Nederlands instituut voor Kunstgeschiedenis

1 Deelproject Spraakherkenning: SHoUT Audio Indexering Service

Periodiekenviewer. Jaargangen digitaal inzichtelijk

grafisch ontwerp voor nieuwe en andere media

TECHNI SHOW MEDIA 2009

Standaarden in het (digitaal) beschrijven van vormgevingsarchieven Bernadine Ypma, zelfstandig onderzoeker

informatie architectuur herkansing eindopdracht rondleiding app voor het stedelijk museum

Allemaal rond de tafel bij kunst- en museumbibliotheken. Inforum, 18 mei 2017 Overleg Kunstbibliotheken Vlaanderen (OKBV)

Een workshop rond het maken van beschrijvingen op collectieniveau

Het archief in cijfers

Nederlandse Gedragswetenschappen Grote Kruistraat 2/1, 9712 TS Groningen. 1. Inleiding

HET WETTELIJK DEPOT VAN NUMERIEKE

PLANETS - Testbed. duizend jaar geschiedenis ligt op honderd kilometer plank van het de geschiedenis dijt uit, jaarlijks met kilometers

VAN PAPIERSTROOM NAAR INFORMATIESTROOM

Reizende expositie Herstel, Groei en Vernieuwing

Algemene voorwaarden voor de levering van reproducties van collectie-items van het KMMA Tervuren

Artistieke toelatingsproef Omschrijving en praktische informatie. Bacheloropleiding in de Beeldende Kunsten

Advertentietarieven International Film Festival Rotterdam. Het festival in cijfers IFFR 2015

EEN LEAR N I NG ANALYTICS S ER VI CE JOHAN JEUR ING

Databank Digitale Dagbladen

Dossier fotobeheer. Inleiding. Samenvatting. 1. Bewaren van originelen. 2. Registreren en digitaliseren

Hoe selecteer je preserveringstools? Sara van Bussel. Koninklijke Bibliotheek

INSPIRATIEBRON VOOR SPELEN, SPORTEN EN BEWEGEN IN DE BUITENRUIMTE

Aanleveren losse bestanden

Rijksoverheid.nl verbeteren met webstatistieken. 12 november 2015

AUTEURSRECHTEN IN DE DIGITALE LEEROMGEVING

Hiervoor heeft u toegang nodig met uw persoonlijke account. Vraag uw account aan, aan de hoofd beheerder.

4. Als u in toekomstige publicaties van onze hand liever anoniem wil blijven dan kunt u dat hieronder aangeven.

Voorbeeld: digitalisering van foto s

Hoofdstuk 4: Sjablonen & Dia Modellen

I would rather design a poster than a website. Aldje van Meer, oktober 2012

Toelating en selectie Selectiecriteria Elke afstudeerrichting hanteert bij de selectie de volgende concrete criteria:

- MARCEL WITTE - LIMITED EDITION - DESIGN LIJST - GICLEE LEVENSLANGE GARANTIE CERTIFICAAT VAN ECHTHEID - BESCHIKBARE GICLEES:

Datanotitie Meertens Instituut

Het beheer van elektronische collecties Guido Goedemé Koninklijke Bibliotheek van België

Cultuur op niveau. De tijdschriften. Ons Erfdeel en Septentrion

Open data Koninklijke Bibliotheek

Toegankelijkheid documenten

Handreiking vervanging archiefbescheiden ELV EO B.V. W W W.ELV EO.N L OOST ER EO.N L

Samenwerken rond collecties Voorbeelden uit de erfgoedbibliotheken An Renard (Erfgoedbibliotheek Hendrik Conscience)

Formaten en tarieven IN EINDHOVEN. Cover. 236 x 390 mm (beeld dient te voldoen aan de richtlijnen van de redactie)

1 Handleiding LIMO Faculteit Architectuur KU Leuven, campus Sint-Lucas Brussel

PERIODIEKENVIEWER. Jaargangen digitaal inzichtelijk. World Class Rapid Digitization of Cultural Heritage

Cijferboek cultureel erfgoed algemeen rapportageverslag

Tariefkaart Vakblad EVMI: gemiddelde gedrukte oplage = gemiddelde verspreide oplage = (HOI-cijfers Q t/m Q3-2014)

Tekstuele databestanden

ATHENA Access to cultural heritage networks across Europe. Presentatie door Chris Vastenhoud

ZoomText ImageReader Website Info

1. Inleiding. 2. De grootte (resolutie) van de foto. Richtlijnen voor aangeleverde foto s

National Geographic Historia Verschijnt 4 keer per jaar Betaalde oplage:

Flandrica.be De virtuele Vlaamse erfgoedbibliotheek

Van document management naar artificial intelligence. BUSINESS INTELLIGENCE - Dé stap naar toekomstgericht werken

Cijferboek cultureel erfgoed algemeen rapportageverslag

Cijferboek cultureel erfgoed algemeen rapportageverslag

Presentatie advies Onderwijs en Open leermiddelen. Tweede Kamer 3 september 2008

Bijeenkomst. Voor Elkaar. 25 januari Utrecht

Flandrica.be De virtuele Vlaamse erfgoedbibliotheek

OUD IS IN. 12 september 2013

GRAFISCH VORMGEVER - AVONDOPLEIDING

Het digitale informatielandschap van de toekomst. Jeanine Tieleman Kwaliteitsmedewerker Digitaal Erfgoed Nederland

Uw productassortiment moeiteloos online én op papier met onze database publishing software.

OPTICAL CHARACTER RECOGNITION (OCR)

Tariefkaart Vakblad Petfood Magazine: gedrukte oplage = ± exemplaren (per 2016)

Legal Intelligence, een nieuwe dienst voor juristen

SAP Invoice Management (SIM)

Hoe open zijn wij? Informatieblad over hergebruik en open data

OPEN CULTUUR DATA Een bottom-up initiatief vanuit de erfgoedsector"

Antwerpen opent zijn digitale kluizen: stedelijke archieven, bibliotheken en musea gaan open data

De onderwerpen die voor deze avond zijn aangedragen! Maskers maken. Workflow Lightroom en Photoshop. Verschil tussen werken in RGB en srgb

Tariefkaart Een heldere kijk op de markt

Projectsubsidies cultureel erfgoed eerste ronde 2015

Hoe vergroten we de waarde van digitale cultuur en digitaal erfgoed? Marco de Niet Digitaal Erfgoed Nederland

Netwerk Digitaal Erfgoed / Werkgroep Monitoring Vragenlijst aan NDE-projecten 2013/2014

Scannen met de kopieertoestellen

MEDIAKIT Wie zijn wij?

Dynamic Publishing on Demand in Social Networks. R.M.G Dols Morpheus Software 2006

museabrugge.be MUSEA BRUGGE Collectiepresentatie georges vantongerloo groeningemuseum I I persdossier

Onderzoeksdata en toegangsrechten

TIPS & TRICKS: HOE MAAK IK MIJN EIGEN LOKALE HELDEN-BANNER?

O r a n j e s t r a a t 2 5 A l m e l o w w w. p r i n t g o e d k o p e r. n l w w w. m u l t i k a n t o o r.

Alfresco Document Management 100% Open Source

De leerlingen leggen hun ervaringen vast in een portfolio.


1. Organisatie: MVG - departement LIN - AMINAL - Afdeling Bos en Groen Doel: inventaris van de bossen

Tariefkaart Vakblad Petfood Magazine: gemiddelde gedrukte oplage = exemplaren (2016)

en EAD implementatie Centraal Register Vormgevingsarchieven (CRVa) Verkenning mogelijkheden EAD implementatie Het CRVa vraagt

Overzicht HvA > V1 > IA 2008 /2009

Transcriptie:

Publisher: Igitur, Utrecht Publishing & Archiving Services. Website: www.tijdschriftstudies.nl Content is licensed under a Creative Commons Attribution 3.0 License URN:NBN:NL:UI:10-1-114147. TS > # 34, december 2013, p. 163-167. TS Tools Het Digitaal Archief van Belgische Neo-Avant-garde-Periodieken (DABNAP) is een onderzoeksproject van de Koninklijke Academie voor Schone Kunsten Antwerpen in samenwerking met de bibliotheek van de Universiteit Antwerpen en de Erfgoedbibliotheek Hendrik Conscience. In oktober 2012 presenteerde Thomas Crombez dit project tijdens het ESPRit-congres The Magazine as Medium. In deze aflevering van TS Tools bespreekt hij samen met Sarah Bekaert de uitgangspunten en gebruiksmogelijkheden van de database. Beide auteurs zijn verbonden aan de Koninklijke Academie van Schone Kunsten, Sint Lucas Antwerpen en de Universiteit Antwerpen. Afb.1: Screenshot van de DABNAP-interface 163

In DABNAP staan de kunstenaarstijdschriften van de naoorlogse vernieuwers centraal, zoals de CoBrA-beweging, de visuele poëzie, de happening en het experimentele theater. Het project richt zich op periodieke kunstenaarspublicaties (self-publishing) van de neoavant-garde. De initiatiefnemers waren individuele kunstenaars of kunstenaarsgroepen die tegelijk verantwoordelijk waren voor de teksten en beelden, de vormgeving, de productie én de distributie. Als collectie bekeken, levert dat een opmerkelijke mix op van literatuur, beeldende kunst, kritiek en essayistiek. Ook op materieel vlak werden uiteenlopende keuzes gemaakt wat betreft formaat, papier en druktechniek. Sommige tijdschriften werden gedrukt, maar vaker werden ze gestencild, en in enkele gevallen werd ook van zeefdruk of fotokopie gebruik gemaakt. De periodieken bereikten in de regel een beperkt publiek. Op enkele uitzonderingen na (zoals De Tafelronde en Heibel) hadden ze bovendien een korte levensduur. De neo-avant-gardistische tijdschriften vertegenwoordigen niet alleen een tijdsgeest, maar zijn ook een verzameling kunstobjecten, en bijgevolg een unieke bron van informatie. Hoewel de erfgoedsector en het academische milieu (internationaal gezien) een groeiende interesse toont voor neo-avant-gardetijdschriften, blijft de belangstelling in België achterlopen. Omdat de periodieken zich tussen het domein van de literatuur en dat van de beeldende kunst bevinden, dreigt deze unieke collectie in beide disciplines naar de achtergrond te verdwijnen. Het onderzoek wordt nog bemoeilijkt doordat de kunstenaarstijdschriften in eigen beheer werden uitgegeven en vaak een beperkte oplage kenden. Volledige reeksen van bepaalde titels zijn moeilijk te vinden. Sommige gestencilde tijdschriften, zoals Anar en Revo, zijn zeer kwetsbaar. Het onderzoeksproject DABNAP wil deze lacune in het onderzoek aanpakken. Meer bepaald stelt het project zich tot doel om het kunstenaarsnetwerk dat zich heeft kunnen vormen en kristalliseren via dit uitgebreide corpus van publicaties, te visualiseren en te analyseren. Dat vraagt om een weloverwogen methodologie op twee niveaus, namelijk het tekstuele en het visuele. Wat het visuele niveau betreft, worden de digitale scans van de originele tijdschriftpagina s op hoge resolutie (600 dpi) gemaakt, zodat de onderzoeker kan inzoomen op details die voor het blote oog moeilijk zichtbaar zijn. Zo wordt beter duidelijk via welke specifieke technieken het drukwerk tot stand kwam (zeefdruk, fotokopie, stencil, offset, e.a.) en voor welke effecten dat zorgt op gebied van typografie, kleur, compositie en lay-out. De gebruikte resolutie is aanzienlijk hoger dan de in bibliotheken en archieven gangbare norm van 300 dpi. De keuze voor deze hoge resolutie brengt namelijk ook een betere kwaliteit van de automatische tekstherkenning met zich mee. Tegelijk zijn er ook nadelen aan verbonden. De hoge resolutie maakt het onpraktisch om met ongecomprimeerde bestandsformaten zoals TIFF te werken, maar verplicht tot gecomprimeerde formaten zoals PDF en JPG. Wat daardoor aan digitale duurzaamheid wordt ingeboet (de compressie is onomkeerbaar), compenseert de hogere kwaliteit van de herkende tekst en van de facsimiles die online kunnen worden aangeboden. 164

De keuze voor hoge-resolutiebeelden is een recent fenomeen. Musea als het Louvre maken gebruik van opnames op hoge resolutie (tot 15 pixels per mm 2 ) om een beperkt aantal topwerken virtueel te exposeren, zodat de gebruiker tot op het niveau van de haarscheurtjes op de verflagen kan inzoomen. Het Google Art Project maakt in samenwerking met negentien musea van wereldniveau (waaronder de Alte Nationalgalerie, het MoMA, de National Gallery en het Rijksmuseum) meer dan duizend werken via hogeresolutie-opnames toegankelijk. In het geval van DABNAP worden de hoge-resolutiebeelden niet via een speciale viewer of zoomfunctie aan de bezoeker aangeboden. De beelden kunnen wel met de ingebouwde functies van de browser op die schaal bekeken worden. Daarnaast is de website ook aangepast aan consultering op toestellen met hoge-resolutieschermen (zogenaamde HiDPI- of Retina-schermen). Ook op het tekstuele niveau worden een aantal innovatieve technieken ingezet, om de digitale collectie voor onderzoekers toegankelijk te maken. Dat gebeurt door de automatisch herkende tekst van de gedigitaliseerde tijdschriften in vier stappen te verwerken: (a) Controle van automatische tekstherkenning Alle scans worden omgezet in tekst met behulp van courant beschikbare OCR-software (Optical Character Recognition). Vanwege de grote diversiteit in gebruikte lettertypes en andere vormen van belettering (handschrift, kleefletters, zeefdruk) is de kwaliteit van de herkende tekst erg wisselend. Bij gedrukte tijdschriften, zoals Cobra of De Tafelronde, is de OCR-output nagenoeg foutloos. Bij gestencilde tijdschriften ligt de foutenmarge heel wat hoger. Daarom werd een interface ontwikkeld die de projectmedewerkers in staat stelt om de automatisch herkende tekst na te kijken en te corrigeren (zie afbeelding 1). (b) Toevoeging van metadata op basisniveau Op dit niveau wordt de documenttekst manueel van de basismetadata voorzien (op niveau van het nummer: tijdschrift, nummer, datum; op niveau van de bijdragen: auteur, titel, paginering) en daarna geïndexeerd. Dat gebeurt via dezelfde interface als hierboven vermeld. De combinatie van deze elementaire data en metadata maakt het mogelijk om op de DABNAP-website niet alleen facsimiles van alle tijdschriftpagina s te presenteren, maar ook full-text search aan te bieden. De resultaten van de zoekacties worden gevisualiseerd via eenvoudige grafieken, die de wisselende frequentie waarmee een woord over het hele corpus vermeld wordt, in beeld brengen. Afbeelding 2 toont een screenshot van deze zoekinterface. Het gezochte woord, happening, blijkt vooral frequent in de late jaren zestig. (c) Elementaire semantische metadata Op het derde niveau wordt de documenttekst door computerlinguïstische software automatisch geanalyseerd. Zo worden de documenten van een tweede semantische laag voorzien. Linguïstische software, meer bepaald het Frog-pakket, ontwikkeld door de ILK-groep (Induction of Linguistic Knowledge) van de Universiteit van Tilburg en door 165

het CLiPS-centrum (Computational Linguistics & Psycholinguistics) van de Universiteit Antwerpen, maakt het mogelijk om automatisch eigennamen te detecteren in Nederlandse tekst. Ook deze informatie wordt als metadata toegevoegd aan de interface van het te ontwikkelen webarchief. (d) Relationele semantische metadata De elementaire metadata die centraal staan op het derde niveau, maken elk tijdschriftnummer en elke pagina van een dergelijk nummer tot een semantisch rijk document. Deze documenten worden in het project geconcipieerd als een mentale ontmoetingsruimte of een evenement waar die namen, organisaties en locaties met elkaar in contact komen. Op het vierde niveau worden deze gegevens automatisch geanalyseerd als een semantisch netwerk van betekenisvolle relaties. De software die aan de basis ligt van het webarchief kan eenvoudige relaties automatisch detecteren (zoals is-auteur-van, is-lidvan, heeft-geëxposeerd-in ). Ook deze meta-informatie wordt op geautomatiseerde wijze toegevoegd aan de webinterface zodat clusters van vaak samen vermelde of met elkaar gerelateerde namen ook samen aan de gebruiker worden gepresenteerd. Afb. 2: De zoekinterface van DABNAP 166

DABNAP ging in januari 2012 van start. Waar staat het project vandaag, na de eerste twee werkjaren? Op dit ogenblik zijn al 27 periodieken gescand en naar tekst omgezet. In totaal betrof het meer dan 33.000 tijdschriftpagina s. Het werkplan voorziet dat er begin 2014 ca. 50.000 pagina s van 40 tijdschriften raadpleegbaar zullen zijn. Van ongeveer de helft van de nu beschikbare pagina s werd de automatisch herkende tekst al nagekeken. Momenteel wordt de aandacht vooral gericht op de automatische herkenning van eigennamen, en de mogelijke procedures en interfaces om deze metadata manueel na te kijken. Voorlopig is DABNAP enkel toegankelijk voor onderzoekers (zowel studenten, promovendi als senior-onderzoekers) die een bijzondere belangstelling voor het materiaal hebben en een motivatie kunnen voorleggen. Tegelijk doet zich een groot probleem voor wat betreft de publieke toegankelijkheid van het gedigitaliseerde materiaal. Hoe kan de levensvatbaarheid van het project worden verzekerd, nadat de voorziene onderzoeksmiddelen zijn uitgeput? Gezien de culturele waarde en de moeilijke beschikbaarheid van de periodieken, ligt een publieke ontsluiting voor de hand. Maar vrijwel alle visuele en tekstuele bijdragen vallen onder het auteursrecht. Daarom werd bij de Vlaamse overheid een erfgoedproject aangevraagd om het enorme corpus aan kunsterfgoed dat in het kader van het onderzoek werd gedigitaliseerd, voor een breed publiek te kunnen ontsluiten. Tegelijk wensen we het traject van deze niet voor de hand liggende ontsluiting (aangezien er op vrijwel alle documenten nog auteursrechten rusten) uitgebreid te documenteren, en als logboek van een casestudy in digitale ontsluiting voor de erfgoedsector beschikbaar te maken. 167