Naar een bibliotheek voor (lees)machines steven.claeyssens@kb.nl @sclaeyssens
Een n-aantal mogelijk talen gebruikt hetzelfde vocabulaire; in sommige laat het symbool bibliotheek de correcte definitie alomtegenwoordig en duurzaam stelsel van zeshoekige galerijen toe, maar bibliotheek is brood of piramide of elk willekeurig ander ding, en de zeven woorden die haar definiëren hebben een andere betekenis.
De Koninklijke Bibliotheek vandaag
1798 nationale bibliotheek opgericht 1806 Lodewijk Napoleon geeft predicaat Koninklijk 1974 Depot van Nederlandse Publicaties gestart 1982 huidige locatie 2002 e-depot (digitaal magazijn) ingericht 2013 tien procent Nederlandse publicaties gedigitaliseerd 2015 integratie BNL, DBNL, SIOB
Gebouw Netto vloeroppervlak: 80.000 m 2 Bibliotheek: 37.000 m 2, waarvan 28.000 m 2 magazijn Andere instellingen in het gebouw: 15.000 m 2
Collecties 7 miljoen items = ruim 115 km boekenplanken 10.000 lopende abonnementen 500 licenties op databanken en digitale tijdschriften Groei [2015] bijna 49.000 boeken ruim 42.000 tijdschriftafleveringen 6,5 miljoen digitale items 2.200 e-boeken 3.800 nieuwe websites
Ambitie: digitaal beschikbaar Digitaliseren van alle Nederlandse boeken, kranten en tijdschriften (700 miljoen pagina s). Toegang bieden tot alle digitale materiaal (digitaal en gedigitaliseerd) en zorgen dat het kan worden gebruikt. Opslaan teneinde de bruikbaarheid voor de komende 50 tot 100 jaar te garanderen.
1. Samenwerking 2. Auteursrecht 3. Collecties als data 4. Digitale geesteswetenschappen De bibliotheek op drift
1. Samenwerking 2. Auteursrecht 3. Collecties als data 4. Digitale geesteswetenschappen De bibliotheek op drift
1. Samenwerking 2. Auteursrecht 3. Collecties als data 4. Digitale geesteswetenschappen De bibliotheek op drift
1. Samenwerking 2. Auteursrecht 3. Collecties als data 4. Digitale geesteswetenschappen De bibliotheek op drift
kb.nl/dataservices delpher.nl/data/kranten
1. Samenwerking 2. Auteursrecht 3. Collecties als data 4. Digitale geesteswetenschappen De bibliotheek op drift
kb.nl/dh
De Koninklijke Bibliotheek morgen
Stelling We moeten (ook) een bibliotheek voor machines worden.
1. Eenheid 2. Kwaliteit 3. Volledigheid 4. Auteursrecht De lezer op drift
1. Eenheid 2. Kwaliteit 3. Volledigheid 4. Auteursrecht De lezer op drift
Documents that were originally physically separately published now form a de facto unit in the digital information space or docuverse. The continuity of this textual space represents a fundamental difference in relation to the world of material documents, where physical separation also means logical separation. [Adriaan van der Weel, Changing our Textual Minds. Towards a Digital Order of Knowledge. Manchester 2011]
Bibliografische eenheid? inhoud, niet vorm tekst, artikel, alinea, paragraaf, woord, titel, editie, aflevering, bibliotheek (in bibliotheek), corpus, dataset = publicatie in publicatie in publicatie in
Praktisch differentiatie Linked Data Optical Layout Recognition (OLR) Named Entities
1. Eenheid 2. Kwaliteit 3. Volledigheid 4. Auteursrecht De lezer op drift
Praktisch: OCR evaluatie correctie post-correctie kwaliteit meten
1. Eenheid 2. Kwaliteit 3. Volledigheid 4. Auteursrecht De lezer op drift
Volledigheid vs. representativiteit productie: gepubliceerd, overgeleverd, gedigitaliseerd druk, herdruk, vertaling, bewerking, consumptie: citaties, oplage, verkoop- en uitleencijfers
Supplying information about provenance in digital archives is also more complicated due to the massive scale of many collections, and due to the fact that one has to distinguish between the provenance of the original record, item, or collection (if it was a physical object that has been digitized), and the provenance of the digital historical representation, or collection of digital historical representations. Thus, digital collections often require additional layers of information about provenance. [Katharina Hering, Provenance Meets Source Criticism, Journal of Digital Humanities 3 (2014), 2.]
Praktisch meer digitaliseren! nationale bibliografie bronnenkritiek publicatiegeschiedenis versiebeleid
1. Eenheid 2. Kwaliteit 3. Volledigheid 4. Auteursrecht De lezer op drift
Praktisch contracten tweede helft twintigste eeuw Text and Data Mining (TDM)
Samengevat We worden een bibliotheek voor mens én machine.
Vragen?