Blauwdruk voor onderhoud, beheer en distributie van door de overheid gefinancierde digitale materialen.

Save this PDF as:
 WORD  PNG  TXT  JPG

Maat: px
Weergave met pagina beginnen:

Download "Blauwdruk voor onderhoud, beheer en distributie van door de overheid gefinancierde digitale materialen."

Transcriptie

1 Blauwdruk voor onderhoud, beheer en distributie van door de overheid gefinancierde digitale materialen. Piet van Sterkenburg, Truus Kruyt en Peter van der Kamp Instituut voor Nederlandse Lexicologie December 2001 Met medewerking van: Diana Binnenpoorte Speech Processing Expertise Centre (SPEX) November

2 Voorwoord. Deze Blauwdruk is een pleidooi voor hergebruik van door de overheid gefinancieerde digitale materialen. Daarom is in de Blauwdruk beschreven welke verschillende aspecten van verwerving, bewerking, administratie, verrijking, beheer, onderhoud en distributie van TSTmaterialen van vitaal belang zijn om tot een solide basis te komen waarop productontwikkeling en onderzoek kunnen plaatsvinden. De Blauwdruk werd geschreven in opdracht van de Nederlandse Taalunie in de periode september december Het onderzoek werd begeleid door Elisabeth D'Halleweyn (Nederlandse Taalunie), Hans Bennis (Meertensinstituut), Theo van den Heuvel (Polderland Language and Speech Technology), Cees Klapwijk (Digitale Bibliotheek voor de Nederlandse Letteren), Willy Martin (Commissie lexicografische Vertaalvoorzieningen) en Frieda Steurs (Lessius Hogeschool). Wij danken de leden van de begeleidingscommissie voor hun commentaar tijdens vier bijeenkomsten waarin de eerste concepten van de verschillende hoofdstukken werden besproken. Deze Blauwdruk zou niet binnen zo'n relatief korte periode tot stand zijn gekomen als niet zo veel medewerkers van het Instituut voor Nederlandse Lexicologie hun medewerking zo belangenloos hadden verleend. Zij verdienen hier daarom een eresaluut: Jeannine Beeken, Marjolijn van Bennekom, Petra Coppens, Katrien Depuydt, Sonja Deutekom, Jesse de Does, Tilly Dutilh, Dirk Geirnaert, Bart Hoogeveen, Dennis Schenk, Rob van Strien, Paulette Tacx, Rob Tempelaars, Boukje Verheij, John van der Voort van der Kleij en Roald Wiegeraad. Leiden, december 2001 Piet van Sterkenburg, Truus Kruyt en Peter van der Kamp Addendum Op verzoek van de Nederlandse Taalunie heeft SPEX, in de persoon van Diana Binnenpoorte, in de loop van 2002 de Blauwdruk bekeken vanuit het perspectief van de spraakwereld. Dit heeft geresulteerd in aanvullingen en wijzigingen waarover overeenstemming bestaat tussen SPEX en het INL. De paragrafen die integraal door SPEX zijn toegevoegd zijn , 3.3., , 3.3.2, , , , en Verder leverde SPEX bijdragen aan de paragrafen 1.2., 2.5., , 2.8., ,3.4., , , , 4.5., 6.2., , , 6.7. en 7.4. Leiden, november 2002 Piet van Sterkenburg, Truus Kruyt, Peter van der Kamp en Diana Binnenpoorte 2

3 Inhoudsopgave 1 INLEIDING ALGEMEEN OM WELKE MATERIALEN GAAT HET? CONCENTRATIEPUNT VAN DE BLAUWDRUK MOGELIJKE GEBRUIKERS DOELSTELLINGEN BLAUWDRUK VERWERVING INLEIDING SCENARIO'S VOOR VERWERVING Individueel Institutioneel Collectief SPECIFIEKE EISEN Juridische aspecten Financiële aspecten Ontwikkeling van een elektronische tekstenverzameling Ontwikkeling van een elektronische verzameling spraak Kosten van door derden ontwikkelde data SELECTIE VAN EEN ELEKTRONISCHE VERZAMELING TEKSTEN Algemeen Selectie door een non-profitorganisatie Selectie door individuele onderzoekers Selectie door taal- en spraaktechnologen ONTWIKKELING VAN EEN ELEKTRONISCHE VERZAMELING SPRAAK Algemeen Selectie door een non-profitorganisatie Selectie door individuele onderzoekers PRODUCTIE EN VERWERVING VAN DIGITALE TEKSTBESTANDEN Scannen Overtypen Verwerving van teksten via Internet Verwerving van databases Verwerving software TECHNISCHE ASPECTEN VAN AANLEVERING VAN VERWORVEN DIGITALE TEKSTEN Aanlevering op magnetische en optische media Aanlevering van teksten via Internet Aanlevering van verworven databases Aanlevering van verworven software Aanlevering als binary Aanlevering als broncode PRODUCTIE EN VERWERVING VAN DIGITALE SPRAAKOPNAMEN Verwerving van reeds bestaande digitale opnamen CONCLUSIES EN AANBEVELINGEN VOOR BELEIDSORGANISATIES BIJLAGEN BIJ HOOFDSTUK Overeenkomst tussen rechthebbende en TST-centrale Overdrachtsovereenkomsten bij de opbouw van een spraakcorpus Licentieovereenkomst computerprogrammatuur Gekozen teksten en corpus VERWERKING EN BEWERKING VAN VERWORVEN DATA INLEIDING VERWERKING EN BEWERKING VAN DATA VOOR EEN ELEKTRONISCHE TEKSTENVERZAMELING Procedures Procedure voor bestanden uit tekstverwerkers Procedure voor zetbestanden Procedure voor ASCII-bestanden Procedure voor SGML-, XML- en HTML-coderingen Procedure voor overige bestanden

4 Procedure voor databases VERWERKING EN BEWERKING VAN DATA VOOR EEN ELEKTRONISCHE VERZAMELING SPRAAK Opnameapparatuur en digitalisering Metadata Annotaties Voorbeeld uit het Corpus Gesproken Nederlands DE DIRECTORY OF DIRECTORYSTRUCTUUR ADMINISTRATIE Van aangeleverde data Van de verwerking en bewerking van verworven data CONCLUSIES EN AANBEVELINGEN VOOR BELEIDSORGANISATIES TAALKUNDIGE BEWERKING VAN TAALMATERIAAL INLEIDING INHOUDELIJKE EN VORMELIJKE ASPECTEN VAN VERRIJKING Algemene aspecten Niveaus en soorten van verrijking Relatie tussen verrijking en de gebruiker Standaarden Procedurele en personele aspecten Verrijking van corpora van geschreven taal Verrijking van het corpus als geheel Verrijking van afzonderlijke teksten Verrijking van tekststructurele eenheden binnen de tekst Verrijking van taalkundige eenheden binnen de tekst Morfologische eigenschappen Morfosyntactische eigenschappen Lemma (trefwoord) Syntactische eigenschappen Semantische eigenschappen Pragmatische eigenschappen Verrijking van corpora van gesproken taal en spraakcorpora Verrijking van het corpus als geheel en van de afzonderlijke getranscribeerde gesproken-taalfragmenten Verrijking van eenheden binnen getranscribeerde gesproken-taalfragmenten Verrijking van spraakcorpora Verrijking algemeen Andere mogelijke verrijkingen, annotatielagen Standaarden en evaluatie Verrijking van digitale woordenboeken Verrijking van een woordenboekcorpus als geheel en van de afzonderlijke woordenboeken Verrijking van eenheden binnen een woordenboek Computationeel lexicon Stappenplannen met werklast en kostenberekening Algemene uitgangspunten Stappenplan met werklast voor de verrijking van een corpus van geschreven taal Verrijking van tekststructurele eenheden in de tekst Verrijking van taalkundige eenheden in de tekst Stappenplan met werklast voor de verrijking van een spraakcorpus Stappenplan met werklast voor de verrijking van een digitaal woordenboek Stappenplan met werklast voor de ontwikkeling van een computationeel lexicon VERRIJKINGSSOFTWARE Overzicht Algemene zaken Stand van zaken: kort overzicht Verrijkingssoftware voor corpora van geschreven taal Software voor tekstclassificatie Software voor verrijking van tekststructurele eenheden Software voor verrijking van taalkundige eenheden Tokeniseren Zinsgrenzen Morfosyntactische analyse en lexiconlook-up Woordsoorttagging Lemmatiseren Het herkennen van woordgroepen

5 Syntactische annotatie Verrijkingssoftware voor spraakcorpora en corpora van gesproken taal Software voor tekstclassificatie Software voor verrijking van tekststructurele eenheden Software voor verrijking van taalkundige eenheden Tokeniseren en zinsgrensdetectie Toekenning van woordsoorttags Lemmatiseren Postprocessing en lexicon Syntactische annotatie Semantische en pragmatische annotatie Prosodische annotatie Overige automatische verrijking van spraakcorpora Software voor de codering van informatiecategorieën in woordenboeken Software voor de ontwikkeling van een computationeel lexicon BIJLAGEN BIJ A Korte uitleg van een aantal classificatieprocedures B Informatie over genoemde datasets CRITERIA VOOR KEUZES BIJ PROGRAMMATUURONTWIKKELING Criteria voor de keuze van hardwareplatform en besturingssysteem Verspreiding van programmatuur Usances binnen het vakgebied Leveranciersregelingen Beschikbaarheid van ontwikkelprogrammatuur Beschikbare middelen Programmatuureisen Criteria voor de keuze van te gebruiken programmeertalen Beoogde duurzaamheid van de programmatuur Hergebruik Oplossingsmethodiek Integrabiliteit en interoperabiliteit Gebruiksaspecten van de programmeeromgevingen Verkrijgbaarheid van compilers; platformonafhankelijkheid Snelheid Kosten Richtlijnen op het niveau van programmeren: namen van variabelen, functies, etc Naamgeving Eenmaligheid van codering Documentatie Het opbouwen van documentatie m.b.v. daarvoor beschikbare gereedschappen Zonder documentatiegereedschappen Commentaar in de broncode en aparte (technische) documentatie Het gebruik van ontwikkelmethoden Algemeen Toepasbaarheid Integratie in bestaande/toekomstige infrastructuren (uniformiteit) Bijdrage aan kwaliteit Relatie onderhoudskosten van de programmatuur Ontwikkelingskosten Probleemoplossend vermogen Richtlijnen voor het opbouwen en gebruiken van testprocedures Inleiding Organisatie Planning van het testen Testomgeving Het testen zelf BIJLAGE BIJ EVALUATIE VAN TST-BASISMATERIALEN INFRASTRUCTURELE VOORZIENINGEN FINANCIËLE ASPECTEN AANBEVELINGEN VOOR BELEID BEHEER INLEIDING BEHEER UITBESTEDEN VS. ZELF BEHEREN

6 5.3 PERSONEEL TECHNISCH BEHEER Beheer apparatuur Beheer data en software Versiebeheer data Versiebeheer software Archivering Systeembeheer Onderhoudspersoneel Conversie van informatiedragers/digitale duurzaamheid BEVEILIGING Beveiliging tijdens opslag en verwerking van gegevens Toegangsbeveiliging Back-up Restore Fysieke beveiliging Beveiliging tijdens transport van gegevens Netwerkbeveiliging Beveiliging netwerktoegang Beveiliging gegevens op netwerk Controle beveiligingsmaatregelen ADMINISTRATIE Met betrekking tot beheer apparatuur Met betrekking tot beheer data en software Met betrekking tot beveiliging Met betrekking tot back-up/restore Met betrekking tot archivering KOSTEN BEHEER CONCLUSIES EN AANBEVELINGEN VOOR HET BELEID BIJLAGEN BIJ HOOFDSTUK Bijlage 1. Onderwerpen in een SLA Bijlage 2. De verschillende rechten t.b.v. beveiliging Bijlage 3. Back-upprocedure ONDERHOUD INLEIDING ONDERHOUD VAN DATA De eigenlijke data Annotaties bij de data en hun taalkundige formats Onderhoud technische formats ONDERHOUD VAN TAALKUNDIGE SOFTWARE EN DATA DIE DOOR DIE SOFTWARE GEBRUIKT WORDEN Taalkundige software Data voor taalkundige software ONDERHOUD SYSTEEM- EN APPLICATIESOFTWARE, COMPUTERPLATFORMS EN INFORMATIEDRAGERS Systeem- en applicatiesoftware Systeemsoftware Applicatiesoftware Computerplatforms Informatiedragers Administratie JURIDISCH ONDERHOUD KOSTEN AANBEVELINGEN VOOR BELEID DISTRIBUTIE INLEIDING SCENARIO'S VOOR DISTRIBUTIE Institutioneel Uitbesteding SPECIFIEKE EISEN Juridische aspecten Financiële aspecten

7 7.4 TECHNISCHE ASPECTEN VAN DISTRIBUTIE VAN TST-MATERIAAL PRAKTISCHE ASPECTEN VAN DISTRIBUTIE CONCLUSIES EN AANBEVELINGEN VOOR BELEIDSORGANISATIES BIJLAGEN BIJ HOOFDSTUK Overeenkomst tussen distributeur en gebruiker Contract tussen leverancier en ELDA Contract tussen eindgebruiker en ELDA Contract tussen een 'value-added reseller' en Elda GEBRUIKERSONDERSTEUNING INLEIDING WEBSITE MAILINGLIJST HELPDESK Helpdesksoftware Personele organisatie LEVERING VAN SOFTWARE EN DATA 'OP MAAT' SOFTWARESERVICES ADVISERING KOSTEN BELEIDSAANBEVELINGEN BELEIDSAANBEVELINGEN INLEIDING AANBEVELINGEN BIBLIOGRAFIE

8 1 Inleiding 1.1 Algemeen Op 19 april 1999 werd door de Nederlandse Taalunie een Nederlands-Vlaams platform voor de Nederlandse taal- en spraaktechnologie (TST) ingesteld. In dit platform zijn de beleidsorganisaties vertegenwoordigd die in Nederland en Vlaanderen verantwoordelijk zijn voor het beleid ten aanzien van taal- en spraaktechnologie. Naast de Nederlandse Taalunie zijn dit in Nederland: het Ministerie van Onderwijs, Cultuur en Wetenschappen, het Ministerie van Economische Zaken, de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO) en Senter; in Vlaanderen: het Ministerie van de Vlaamse Gemeenschap/Administratie Wetenschap en Innovatie (AWI), het Instituut voor de Bevordering van het Wetenschappelijk-Technologisch Onderzoek in de Industrie (IWT) en het Fonds voor Wetenschappelijk Onderzoek (FWO). Dit platform stelde in 1999 het Actieplan voor het Nederlands in taal- en spraaktechnologie vast, waarin vier actielijnen, A, B, C en D, gedefinieerd zijn. Actielijn A streeft een betere samenwerking tussen industrie, academia en beleidsinstanties na en wil de zichtbaarheid van het veld verbeteren. Actielijn B heeft als taak te definiëren wat de BATAVO (Basis-Taal&Spraak-Voorziening) voor het Nederlands moet inhouden, welke materialen met voorrang dienen te worden ontwikkeld (prioriteitenlijst) en welke kosten daaraan verbonden zijn. Actielijn C heeft als doel een lijst met criteria op te stellen waaraan basismaterialen moeten voldoen en stelt standaarden op voor de validatie van de materialen. Actielijn D uit het Actieplan betreft het laten uitwerken van een Blauwdruk voor verwerving, onderhoud, beheer en distributie van door de overheid gefinancierde digitale materialen. Waarom zo'n Blauwdruk? Verschillende organisaties worden in de praktijk geconfronteerd met verwerving, beheer, onderhoud en distributie van TST-materialen. Instanties financieren vaak alleen het ontwikkelen van materialen en voelen zich niet meer verantwoordelijk na afloop van het project. Materialen die niet worden onderhouden, verminderen echter snel in waarde en onduidelijke auteursrechtelijke afspraken kunnen exploitatie bemoeilijken. 1.2 Om welke materialen gaat het? Om elk misverstand uit te sluiten benadrukken wij dat het hier hoofdzakelijk gaat om materialen voor taal- en spraaktechnologie die met overheidsgelden buiten een permanente institutionele infrastructuur gemaakt worden. De Nederlandse Taalunie heeft gevraagd bij de uitwerking van de Blauwdruk het hoofdaccent op juist die materialen te leggen. De consequentie van die keuze is dat de Blauwdruk slechts incidenteel en wanneer dat om contrastieve redenen onvermijdelijk is, in kan gaan op aspecten die buiten deze focus vallen. Zo zullen er wel raakvlakken zijn met bijvoorbeeld de wijze waarop literaire corpora verworven, beheerd en gedistribueerd kunnen worden, maar hoe een tekst literair verrijkt kan of bij voorkeur dient te worden, zal men er niet in vinden. Ook de problematiek waarvoor bijvoorbeeld een instelling als het Meertens-Instituut geplaatst is met zijn grote hoeveelheden met de hand ingevulde dialectvragenlijsten valt buiten het kader van deze Blauwdruk. Hetzelfde geldt voor het beheren van twee- of meertalige bestanden en voor terminologieën. Wat expliciet uitgesloten is in de Blauwdruk zijn de digitale materialen van archieven en bibliotheken. Dat geldt, op verzoek van Taalunie, voorlopig ook voor de materialen en methoden die ontwikkeld zijn door het bedrijfsleven. 8

9 De materialen die wel onderwerp van bespreking zijn, zijn primair corpora van geschreven en gesproken Nederlands, spraakcorpora 1, computationele lexica, elektronische traditionele woordenboeken en software voor taal- en spraaktechnologie; in het vervolg TSTmaterialen genoemd, of specifieker TST-data en TST-software. 1.3 Concentratiepunt van de Blauwdruk De Blauwdruk houdt rekening met algemene, internationale tendensen en geeft nadruk aan wat op binationaal niveau (Nederland en Vlaanderen) wordt nagestreefd. Dat betekent dat de vigerende internationale hoofdstromen ten aanzien van materialen en methoden van verwerving, taalkundige verrijking, opslag en beheer e.d. besproken zullen worden. In nauwe aansluiting daarbij zullen als leidraad voor deze beschrijving dienen de vigerende nationale aanbevelingen uit de rapporten van Viskil (1999) en Bouma en Schuurman (1998), alsmede het Actieplan voor het Nederlands in Taal- en Spraaktechnologie (1999) van de Nederlandse Taalunie, zeer in het bijzonder Actielijn D. Rekening houden met algemene, internationale tendensen impliceert echter niet dat er geen andere of zelfs betere protocollen denkbaar zijn. Zo is wat er geschreven wordt over de grote multifunctionele corpora van geschreven taal met al hun faciliteiten voor selectie van subcorpora wel een internationale tendens, maar wordt die beschrijving niet als het ultieme protocol aangeboden van de manier waarop corpora opgebouwd dienen te worden. Ook worden er voorbeelden gegeven zonder dat ze als standaard bepleit worden. Zo is wat gezegd wordt van het Corpus Gesproken Nederlands slechts een voorbeeld van hoe je een spraakcorpus naar analogie van het British National Corpus kunt opbouwen. In de Blauwdruk wordt door de stellers ervan verantwoord hoe dingen elders gedaan worden en hoe zij zelf hun oplossingen inrichten. Het is evident dat elke andere instelling haar eigen protocollen naar eigen inzichten zal hanteren. Wat hier gepresenteerd wordt, is informatief beschrijvend en geen wet. 1.4 Mogelijke gebruikers Gebruikers kunnen vanuit diverse invalshoeken beschouwd worden: 1) Wie zijn degenen die gebruik willen maken van TST-materiaal dat met overheidsgelden buiten een permanente institutionele infrastructuur gemaakt is? 2) Voor welke doeleinden willen ze dat materiaal gebruiken? 3) Welke status heeft de gebruiker? 4) Welke relatie heeft de gebruiker tot andere betrokkenen? De impliciete achtergrond van (1) is dat genoemd materiaal het meest rendeert als zo veel mogelijk gebruikers van hetzelfde TST-materiaal gebruik maken. De relatie die beoogd wordt tussen gebruikers en hergebruik van TST-materialen is gebaseerd op multifunctionaliteit. Een Europese studie naar wie die gebruikers zijn en waaraan ze behoefte hebben, was onderdeel 1 Corpora bestaande uit getranscribeerde lopende spraak worden in de corpuslinguïstiek 'corpora van gesproken taal' of 'gesproken-taalcorpora' genoemd, als tegenhanger van de veel frequenter voorkomende corpora van geschreven taal. In de spraakwereld wordt een andere terminologie gehanteerd. Onder de corpora van gesproken taal worden de corpora die naast de orthografische transcripties ook de bijbehorende spraakfiles bevatten spraakcorpora genoemd. Een spraakcorpus is mitsdien een verzameling van spraakbestanden, met minstens een orthografische transcriptie in elektronische vorm, met bijbehorende documentatie (labelfiles en transcriptieconventies) en eventueel met een lexicon. Deze moeten zijn opgeslagen in een formaat dat leesbaar en bereikbaar is met een computer. Het onderscheid in terminologie werd duidelijk tijdens de bijdrage van SPEX aan de Blauwdruk; hoewel de nodige aanpassingen zijn aangebracht, is inconsistent gebruik van de terminologie niet uitgesloten. Vgl. ook

10 van o.a. het NERC-project (Teubert 1995). Een dergelijke studie gericht op de huidige situatie voor het Nederlandse taalgebied valt buiten het bestek van deze Blauwdruk. Niettemin kunnen wel een aantal gebruikersgroepen genoemd worden: (a) Taal- en spraaktechnologen, waaronder we al diegenen rekenen die zich op welke wijze dan ook bezig houden met natuurlijke-taalverwerking door computers, dus onderzoekers die onderzoeken hoe je komt tot de beste automatische taalontleders (in de meest ruime zin: van spellingcheckers tot automatische semantische analyse), tot automatische spraakherkenning en spraaksynthese, maar ook commerciële ontwikkelaars van natuurlijke-taalverwerkende (modules van) systemen voor bijvoorbeeld automatisch vertalen, automatisch samenvatten, documentretrieval, mens-machinecommunicatie, informatieretrieval, natuurlijke-taalgeneratie, tekst-naar-spraakomzetting, etc. Hieronder kunnen ook begrepen worden ontwikkelaars van hulpmiddelen voor bepaalde categorieën gehandicapten. (b) De onderwijssector, waar TST-materiaal gebruikt wordt als lesmateriaal. Onder andere via Kennisnet worden digitale bestanden verworven en gebruikt. (c) Onderzoekers, overheidsinstellingen, geïnteresseerde particulieren, documentalisten en anderen die TST-data willen bevragen als een kennisbank. (d) Deze opsomming laat zien dat TST-materiaal voor zeer diverse doeleinden gebruikt wordt. Vanuit de tweede invalshoek is de volgende indeling in gebruikersgroepen relevant vanwege potentiële juridische en financiële consequenties voor het gebruik van het materiaal: (a) Gebruikers die onderzoek doen met TST-materiaal zonder enig winstoogmerk en zonder dat een commerciële toepassing die uit dit gebruik kan voortkomen waarschijnlijk is. (b) Gebruikers die onderzoek doen met als oogmerk de ontwikkeling van commerciële toepassingen, diensten of (half)producten. In dit stadium wordt winst beoogd maar nog niet verkregen. (c) Onderzoekers en (overheids-, onderwijs-)instellingen die TST-materiaal gebruiken in en voor commerciële toepassingen, diensten of (half)producten. Vanuit de derde invalshoek zijn de volgende gebruikersgroepen te onderscheiden, eveneens vanwege potentiële juridische en financiële consequenties voor het gebruik van het materiaal: (a) De gebruiker is een individu. (b) De gebruiker is werkzaam in een onderzoeksgroep of (dienstverlenende) nonprofitorganisatie. (c) De gebruiker is werkzaam in het bedrijfsleven. (d) De gebruiker is een onderzoeksinstelling of (dienstverlenende) non-profitorganisatie. (e) De gebruiker is een commercieel bedrijf. Vanuit de vierde invalshoek is er onderscheid tussen: (a) De gebruiker is geheel en al de maker van het TST-materiaal. (b) De gebruiker is de bewerker van materiaal van anderen. (c) De gebruiker betrekt zijn materiaal van een beherende en/of distribuerende instantie. 1.5 Doelstellingen Blauwdruk Op grond van bovenstaande constateringen wil de hier voorliggende Blauwdruk beantwoorden aan de volgende doelstellingen: 10

11 1) Hij moet informatie leveren en evaluatiecriteria aanreiken waarop beleidsorganisaties zich kunnen baseren bij het beoordelen van projectaanvragen die betrekking hebben op het ontwikkelen van TST-materialen. 2) Hij moet informatie leveren waarop beleidsorganisaties zich kunnen baseren bij het opstellen van beleidsplannen en begrotingen waarin verwerving, onderhoud, beheer en distributie van TST-materialen een rol spelen. 3) Hij moet praktische informatie leveren aan organisaties die in de praktijk geconfronteerd worden met verwerving, onderhoud, beheer en/of distributie van TST-materialen. 4) Hij moet een antwoord geven op de vragen hoe TST-materiaal na voltooiing van grote projecten, nationaal en internationaal hergebruikt kan worden en aan welke prioriteiten moet worden voldaan om die doelstelling te verwezenlijken. 5) De gevraagde informatie over het ontwikkelen, beheren, onderhouden en distribueren zal in acht hoofdstukken worden uitgewerkt. Hoofdstuk 2 Verwerving In dit hoofdstuk wordt aandacht besteed aan scenario's voor de verwerving van materialen voor taal- en spraaktechnologie (2.2.). Vervolgens worden specifieke juridische (zie ) en financiële (2.3.2.) eisen besproken. Deze paragrafen betreffen aspecten die algemeen gelden voor TST-materialen (TST-data en TST-software). Daarom worden die aspecten voorop geplaatst in de uitwerking van dit hoofdstuk. Voorts wordt meer specifiek aandacht besteed aan de selectie van een elektronische tekstenverzameling (zie 2.4.) en aan die van een elektronische verzameling spraak (2.5.). Bij beide dataverzamelingen komen zaken van selectie en ontwikkeling aan de orde, die achtereenvolgens vanuit het perspectief van een non-profitorganisatie, maar ook vanuit dat van de individuele onderzoeker zullen worden besproken. Vervolgens wordt aandacht gevraagd voor zaken als: verwerving, productie en aard van de digitale tekstbestanden dan wel technische aspecten bij aanlevering van digitale bestanden (2.6. en 2.7.) en de productie en verwerving van (digitale) opnamen van spraakcorpora (2.8.). De ontwikkeling van andere TST-data (zoals bijvoorbeeld corpusgebaseerde computationele lexica, trainingscorpora, (multimodale) corpora) en van TST-software (zoals bijvoorbeeld woordsoorttaggers, automatische zinsontleders, annotatiesoftware) komt aan de orde in hoofdstuk 4. In 2.9., dat weer een algemener karakter heeft, zullen omtrent de verwerving van TSTmaterialen aanbevelingen worden gedaan aan beleidsorganisaties. In bijlagen worden modellen van juridische overeenkomsten toegevoegd (2.10.). Hoofdstuk 3 Verwerking en bewerking van verworven data In dit hoofdstuk staan verwerking, bewerking en administratie van TST-data centraal, in het bijzonder die van verzamelingen teksten en spraak. In paragraaf 3.2. beschrijven wij procedures voor de wijze waarop data voor een elektronische tekstenverzameling verwerkt, bewerkt en geadministreerd worden. Paragraaf 3.3. besteedt aandacht aan de verwerking en bewerking van data in een elektronische verzameling spraak. Zoals zal blijken, spelen conversie- en adaptatieprocedures in dit hoofdstuk een belangrijke rol ( en ). Waarom het opzetten van een goed gestructureerde directory van vitaal belang is bij de opslag van verworven data wordt beschreven in 3.4. Ten slotte worden de voordelen van een inzichtelijke en functionele administratie in 3.5. besproken. In paragraaf 3.6. worden conclusies getrokken en aanbevelingen voor beleidsorganisaties gedaan. 11

12 Hoofdstuk 4 Taalkundige bewerking van taalmateriaal Dit hoofdstuk gaat over taalkundige bewerking van taalmateriaal, dat wil zeggen het toevoegen van taalkundige informatie aan digitaal taal- en spraakmateriaal ('verrijking)'. Het digitale materiaal betreft corpora van geschreven en gesproken taal (dat verworven en technisch bewerkt is als uiteengezet in de hoofdstukken 2 en 3), spraakcorpora, digitale woordenboeken, computationele lexica, uitspraaklexica, etc.. In de inleiding (4.1.) wordt het nut van verrijking uitgelegd en wordt een gedetailleerde opzet van dit hoofdstuk gegeven gaat over de inhoudelijke en vormelijke aspecten van verrijking. De opzet van deze paragraaf is van algemeen naar specifiek is bedoeld voor lezers die een globaal beeld willen hebben van wat aan de orde is bij verrijking. De volgende vier paragrafen, , bieden nadere informatie aan lezers die hun weg willen vinden in de wereld van resp. de verrijking van geschreven-taalcorpora en spraakcorpora, de verrijking van digitale woordenboeken tot elektronische woordenboeken en de ontwikkeling van computationele lexica, (multimodale) spraakcorpora, etc geeft stappenplannen om te komen tot resp. een verrijkt tekstcorpus ( ), een verrijkt of geannoteerd spraakcorpus ( ), een elektronisch woordenboek ( ) en een computationeel lexicon ( ), met daarbij het type personeel dat nodig is en indicaties van de werklast. Deze paragraaf is bedoeld voor wie deze typen verrijkte data wil gaan ontwikkelen, voor de beoordelaars van dergelijke dataontwikkelingsprojecten en voor wie verrijkte data moet onderhouden. Tevens is deze paragraaf de basis voor kostenramingen betreffende het onderhoud van dergelijke data (vgl. 6.6.) 4.3. gaat over taalkundige programmatuur waarmee verschillende vormen van verrijking, zoals behandeld in 4.2., automatisch kunnen worden aangebracht. Ook deze paragraaf heeft een opzet van algemeen naar specifiek. Deze paragraaf is bedoeld voor taaltechnologen die zich op het Nederlands richten. In worden algemeen geldige aspecten behandeld. Deze paragraaf is bedoeld voor genoemde taaltechnologen en voor wie een project waarin automatische taalkundige verrijking beoogd wordt, wil opzetten of beoordelen. In wordt meer in detail aandacht besteed aan resp. software voor de verschillende vormen van verrijking van corpora van geschreven en gesproken taal, software voor de codering van informatiecategorieën in digitale traditionele woordenboeken en software voor de ontwikkeling van een computationeel lexicon. De werklast van automatische taalkundige verrijking is verwerkt in gaat in op keuzes die een organisatie die TST-materialen ontwikkelt moet maken bij de ontwikkeling en het testen van taalkundige programmatuur. Die keuzes betreffen hardwareplatforms, besturingssystemen, programmeertalen. Ook komen richtlijnen voor het programmeren, documentatieaspecten, het gebruik van ontwikkelmethoden en criteria voor het opbouwen en gebruiken van testprocedures aan de orde. Deze paragraaf is bedoeld voor automatiseringsdeskundigen en op onderdelen voor computerlinguïsten geeft de stand van zaken weer met betrekking tot de evaluatie van de dataverzamelingen en taalkundige software die in de voorgaande paragrafen besproken zijn gaat over infrastructurele voorzieningen, op internationaal, nationaal en lokaal niveau behandelt financiële aspecten, gebaseerd op en op biedt aanbevelingen voor beleid, vanuit het perspectief van dit hoofdstuk en de taken van de TST-centrale daarbij. 12

13 Hoofdstuk 5 Beheer In dit hoofdstuk staat het beheer centraal van de verzameling digitale teksten en/of de verzameling spraak, hierna aangeduid met 'data', alsook het beheer van software. Onder software wordt in dit hoofdstuk verstaan: TST-programmatuur, al dan niet in eigen beheer ontwikkeld en overige software zoals bijvoorbeeld systeemprogrammatuur. Het optimaal gebruik van data en software valt of staat met goed beheer. De uitval van een computer waarop data zijn opgeslagen die snel beschikbaar moeten zijn, is op zich al vervelend, maar kan ernstige vormen aannemen als bijv. blijkt dat het onderhoud van de betreffende computer niet goed is geregeld. Over dit soort aspecten gaat het onder meer in dit hoofdstuk. De indeling van dit hoofdstuk is als volgt. Eerst zal in 5.2. aandacht worden besteed aan de vraag of het beheer moet worden uitbesteed of dat het in eigen hand moet worden gehouden. In aansluiting daarop wordt in 5.3. ingegaan op de kwalificaties voor het personeel dat de beheertaken moet uitvoeren. In 5.4. zal het technische beheer worden besproken. Onderdelen van deze paragraaf zijn beheer van de apparatuur (5.4.1.), beheer van data en software en archiveringskwesties (5.4.2.) en de conversie van informatiedragers (5.4.3.). In 5.5. staat beveiliging centraal. Hierbij wordt onderscheid gemaakt tussen beveiliging tijdens opslag en verwerking (5.5.1.) en beveiliging tijdens transport van gegevens (5.5.2.). In 5.6. zal de administratie m.b.t. beheer aan de orde komen. In 5.7. worden kosten genoemd die met beheer samenhangen. Het hoofdstuk wordt afgesloten met conclusies en aanbevelingen voor beleidsorganisaties (5.8.). Hoofdstuk 6 Onderhoud Eenmaal verworven of ontwikkelde taalmaterialen voor TST vereisen onderhoud om hun bruikbaarheid te behouden. In de planning van tijdelijke projecten waarin taalmateriaal wordt ontwikkeld, is het aspect onderhoud veelal afwezig of onderbelicht (ook financieel), mede doordat onderhoud vooral speelt na afloop van een project. Dit leidt op den duur tot kapitaalvernietiging doordat de taalmaterialen niet meer bruikbaar zijn. In het kader van de actielijnen van het TST-platform is het zaak voor de Nederlands Taalunie om aan het onderhoudsaspect voldoende aandacht te geven. Dit hoofdstuk biedt daartoe de instrumenten. Onderhoud omvat (a) technisch onderhoud, (b) inhoudelijk onderhoud en (c) juridisch onderhoud. Hetgeen onderhoud vereist zijn data, eventuele annotaties daarbij en hun taalkundige en technische formats (6.2.), taalkundige software en data die door die software gebruikt worden (6.3.) systeemsoftware, computerplatforms en informatiedragers (6.4.) en contracten met leveranciers, ontwikkelaars, distributeurs, gebruikers en sprekers (6.5.). Bij al deze onderwerpen zijn er relaties met andere hoofdstukken. Dit hoofdstuk wordt besloten met een financiële paragraaf (6.6.) en beleidsaanbevelingen (6.7.). Hoofdstuk 7 Distributie De distributie van materialen ten behoeve van taal- en spraaktechnologie (TST-materialen) kan geschieden volgens verschillende scenario's (7.2.). In paragraaf worden juridische eisen besproken die bij de distributie van TST-materialen vervuld moeten worden. De financiële zaken die samenhangen met distributie wordt geschetst in paragraaf Hoe de data technisch gedistribueerd kunnen worden staat te lezen in paragraaf 7.4. In 7.5. worden andere randvoorwaarden voor distributie behandeld met een praktisch karakter, zoals het voorzien in een handleiding en documentatie bij het gedistribueerde product. Ook komen daar overwegingen aan de orde voor het maken van technische keuzen en de automatische 13

14 financiële verrekening en afhandeling. Dit hoofdstuk wordt afgesloten met conclusies en aanbevelingen voor beleidsmakers (7.6.) en modelcontracten (7.7.). Hoofdstuk 8 Gebruikersondersteuning Distributie impliceert gebruikersondersteuning: gebruikers moeten terecht kunnen met vragen en verzoeken. De beschreven ondersteuning betreft een website met on-line helpinformatie (8.2.), een helpdesk (8.3.), een mailinglijst (8.4.), de levering van software en data 'op maat' (8.5.), softwareservices (8.6.) en advisering (8.7.). Paragraaf 8.8. gaat in op het kostenaspect en 8.9. geeft enige aanbevelingen voor beleid. Hoofdstuk 9 Beleidsaanbevelingen Op basis van het voorgaande worden in dit hoofdstuk een achttal aanbevelingen gedaan. In de eerste aanbeveling wordt de instelling van een zogeheten TST-centrale bepleit. De tweede betreft de vorm van de TST-centrale en de rol van de Nederlandse Taalunie. De derde bespreekt de taken van de TST-centrale, onderscheiden in hoofd- en neventaken. De vierde en vijfde gaan over de kosten die door resp. de overheid en de gebruikers van de TST-centrale gedragen moeten worden. De overige gaan achtereenvolgens over de voorwaarden van acceptatie van TST-materialen door de TST-centrale, internationale participatie en de ontwikkeling en het behoud van TST-expertise. 14

15 2 Verwerving 2.1 Inleiding Het verwerven van materialen voor taal- en spraaktechnologie kan geschieden volgens verschillende scenario's (2.2.) en stelt bovendien zijn specifieke juridische (zie ) en financiële (2.3.2.) eisen. Deze paragrafen betreffen aspecten die algemeen gelden voor TSTmaterialen (TST-data en TST-software). Daarom zullen wij die aspecten voorop plaatsen in de uitwerking van dit hoofdstuk. Voorts zullen wij meer specifiek aandacht besteden aan de selectie van een elektronische tekstenverzameling (zie 2.4.) en aan die van een elektronische verzameling spraak (2.5.). Bij beide dataverzamelingen komen zaken van selectie en ontwikkeling aan de orde, die achtereenvolgens vanuit het perspectief van een non-profitorganisatie, maar ook vanuit dat van de individuele onderzoeker zullen worden besproken. Vervolgens wordt aandacht gevraagd voor zaken als: verwerving, productie en aard van de digitale tekstbestanden dan wel technische aspecten bij aanlevering van digitale bestanden (2.6. en 2.7.) en de productie en verwerving van (digitale) opnamen van spraak (2.8.). Voor de ontwikkeling van andere TST-data (zoals corpusgebaseerde computationele lexica, trainingscorpora voor taalkundige toepassing, (multimodale) corpora, etc.) en van TSTsoftware (zoals woordsoorttaggers, automatische zinsontleders, annotatiesoftware, etc.) verwijzen wij naar hoofdstuk 4. In 2.9., dat weer een algemener karakter heeft, zullen omtrent de verwerving van TSTmaterialen aanbevelingen worden gedaan aan beleidsorganisaties. In bijlagen worden modellen van juridische overeenkomsten toegevoegd (2.10.). 2.2 Scenario's voor verwerving Individueel Elke onderzoeker kan met kennis van zaken en via persoonlijke contacten proberen zelf zijn weg te vinden in de her en der (toevallig) beschikbare, al dan niet gedocumenteerde TSTmaterialen. Bij veel onderzoekers is evenwel niet altijd bekend of en waar er voor hun onderzoek geschikte TST-materialen beschikbaar zijn. En zijn zij al beschikbaar, dan ontbreekt vaak een goed inzicht in de kwaliteit en gebruiksvoorwaarden daarvan. Regelmatig zijn onderzoekers ook niet bekend met belendende problemen van juridische, financiële en technische aard. In veel gevallen is het dan ook niet zonder risico om bij de acquisitie van TST-materialen alleen op het eigen kompas te varen Institutioneel De onderzoeker kan grote juridische en financieel-economische problemen voorkomen door TST-materiaal te betrekken van of te laten aanmaken door een reeds bestaande nationale of internationale organisatie die met overheidsgelden binnen een permanente institutionele infrastructuur TST-materialen aanmaakt en verwerft. Ook kan zo'n instelling voorzien in technische aspecten (computerplatform, formaat, conversie e.d.). Binnen het veld van taal- en spraaktechnologie is er evenwel enige aarzeling om één instelling verantwoordelijk te stellen voor de verwerving en aanmaak van TST-materialen. Die aarzeling wordt vooral gevoed doordat zo'n instelling vaak zeer gespecialiseerd is in slechts een beperkt domein van taal- en spraaktechnologie, zoals bijvoorbeeld in de aanleg 15

16 van corpora van geschreven taal of van spraakcorpora, in de ontwikkeling van taalkundige software of van bevragingssoftware etc Collectief Instellingen die beschikken over een permanente institutionele infrastructuur en die tevens duidelijk afgebakende statutaire doelstellingen hebben zouden samen één rechtspersoon moeten vormen (een consortium bijvoorbeeld) die zich verantwoordelijk stelt voor de verwerving en aanmaak van TST-materialen. Iedere instelling die aangesloten is bij zo'n consortium blijft de kwalitatief goede TST-materialen ontwikkelen waarin ze gespecialiseerd is. De onderlinge afstemming en samenwerking tussen de leden van het consortium wordt geregeld door een coördinerende instantie. Een dergelijke constructie, in het vervolg de TSTcentrale genoemd, zal het meest renderen voor het taal- en spraaktechnologisch onderzoek. 2.3 Specifieke eisen Juridische aspecten Op TST-materialen, of het nu gaat om TST-data of TST-software, berust auteursrecht. "Aan elk werk van letterkunde, wetenschap of kunst is van rechtswege vanaf zijn ontstaan een exclusief beschikkingsrecht voor de maker verbonden. Dit exclusieve beschikkingsrecht omvat onder andere de rechten om te beslissen over openbaarmaking en verveelvoudiging (exploitatierechten), om als maker te worden aangemerkt en om te beslissen over wijzigingen in het werk (persoonlijkheidsrechten). Voor auteursrechtelijke bescherming moet het betreffende werk wel een voldoende oorspronkelijk karakter hebben. De exploitatierechten zijn overdraagbaar. Persoonlijkheidsrechten zijn in principe niet overdraagbaar, de rechthebbende kan wel te kennen geven dat hij zich niet op bedoeld recht zal beroepen." (Bouma en Schuurman 1998: 16). Als TST-materialen auteursrechtelijk beschermd zijn, mogen ze zelden zonder voorafgaande afspraken door derden gebruikt worden. Het is verboden ze 'openbaar te maken' en te 'vermenigvuldigen', behalve onder bepaalde condities en voor strikt persoonlijk gebruik. Het auteursrecht laat anderzijds alles toe waarover overeenstemming bereikt is tussen de gebruiker of een intermediërende instantie enerzijds en de auteursrechthebbende(n) anderzijds. De centrale vraag is dus hoe wij de toestemming voor hergebruik van TST-materialen kunnen verwerven. Daarbij moet duidelijk zijn waar de rechten op die materialen liggen en wat er onder gebruik en hergebruik wordt verstaan. Wat de verschillende rechten betreft, blijken die te vaak niet ondubbelzinnig te zijn vastgelegd. Zo is de feitelijke maker bijvoorbeeld niet de juridische maker als het werk volgens een nauw omschreven opdracht wordt gemaakt of als het werk gemaakt wordt door een werknemer die hiervoor in dienst is genomen. De rechten komen dan niet toe aan de werkelijke maker van een werk (de werknemer-auteur), maar aan degene die door de wet als fictieve maker (de werkgever) wordt beschouwd. (Bouma en Schuurman 1998: 18). Een complicerende factor is nog of die werknemer is tewerkgesteld bij een universiteit of een andere kennisinstelling, dan wel een bedrijf en of het daarbij wel of niet gaat om een project gefinancierd door derden (bijvoorbeeld EU). Daarnaast moet niet worden vergeten dat personen die hun spraak lenen aan de verzameling van een spraakcorpus de eigenaar blijven van het bestand waarin hun spraak is opgeslagen. Zij kunnen dit recht overdragen aan de maker van het corpus door het tekenen van een zogenoemde vrijgaveverklaring. 16

17 In elk taalgebied worden door zowel professionelen als amateurs TST-materialen ontwikkeld. De makers van die materialen zijn de rechthebbenden in de zin van de auteurswet. Zij kunnen dat auteursrecht overdragen aan een uitgever of aan een andere rechtverkrijgende, dan wel een gebruikslicentie verlenen. "Met het verlenen van een licentie wordt aan een niet-rechthebbende de toestemming gegeven om het auteursrechtelijk beschermde werk op een andere wijze openbaar te maken of te verveelvoudigen. Het auteursrecht zelf blijft in handen van de licentiegever. In geval van niet-exclusieve licentie blijft de auteursrechthebbende ook zelf gerechtigd tot het zelfstandig exploiteren van het werk en kan hij ook anderen een soortgelijke toestemming geven. Bij een exclusieve licentie verplicht hij zich tegenover de licentienemer om aan anderen geen soortgelijke toestemming te verlenen." (Bouma en Schuurman 1998: 16). Met uitzondering van commerciële ondernemers, ontwikkelen de meeste rechthebbenden hun TST-materialen voor eigen behoeften en vaak voor ad-hocgebruik. Het geschikt maken voor hergebruik, het op peil houden en valideren van die TST-materialen behoort meestal niet tot de kern van hun activiteiten. Om die reden is een TST-centrale nodig die rechthebbenden stimuleert om dergelijke TST-materialen onder nader overeen te komen voorwaarden ter beschikking te stellen van anderen. Toestemming van de rechthebbende(n) moet vooraf verkregen worden voordat werk, d.w.z. tijd en geld, besteed wordt aan de bewerking van geselecteerd en verworven TST-materiaal. Dit geldt ook ingeval een individuele onderzoeker TST-materiaal aanlevert aan de TSTcentrale. Het verdient aanbeveling die toestemming schriftelijk te verkrijgen in de vorm van een contract. Bij voorkeur wordt gewerkt met een standaardmodel voor dat contract tussen de recht- of licentieverwervende en de rechthebbende(n), met verschillende opties of verschillende contractvarianten voor de diverse typen van gebruik c.q. gebruikers (vgl. 1.4.). Dit maakt enerzijds de administratieve afwikkeling efficiënter, anderzijds perkt het een diversiteit aan gebruikscondities in. Zo'n standaardmodel bevat onder meer clausules die vastleggen wat door wie wanneer met de TST-materialen gedaan mag worden. De formulering hiervan vergt een uiterste zorgvuldigheid. Expliciet moet voorzien worden in een nauwkeurige beschrijving van het type gebruik of gebruiker. De voorwaarden moeten bij voorkeur zo geformuleerd worden, dat voorkomen wordt dat in een later stadium opnieuw toestemming moet worden gevraagd voor een ander type gebruik of gebruiker. De formulering van de condities op het gebruik van TST-materialen moet dus enerzijds heel expliciet zijn en anderzijds voldoende ruimte laten om niet voorzien gebruik te dekken. In het contract met rechthebbenden moet bepaald worden of een gebruikersovereenkomst uitsluitend met individuen gesloten zal worden of ook met onderzoeksgroepen respectievelijk instellingen. Contracten die de verantwoordelijkheden en verplichtingen regelen van beide partijen dienen door zo'n TST-centrale opgesteld te worden. In het volgende schema, dat wij ontlenen aan de European Language Resources Association (Choukri, Mance & Mapelli 2000: 69), wordt rekening gehouden met het belang van beide partijen, t.w. rechthebbende(n) en gebruikers. 17

18 rechthebbende(n) TST-centrale gebruikers zonder winstoogmerk gebruikers t.b.v. productontwikkeling, nog zonder winst gebruikers t.b.v. productontwikkeli ng, met winst Indien wij het model verwoorden, dan worden er contracten gesloten tussen de TST-centrale en de rechthebbende(n) van TST-materialen enerzijds en tussen de TST-centrale en de gebruiker van de TST-materialen anderzijds. Het kan ook voorkomen dat de TST-centrale een contract sluit met een gebruiker die de TST-materialen, na ze verrijkt te hebben, doorverkoopt. Belangrijk is dat de TST-centrale verifieert of aanbieders van TST-materialen de rechten bezitten die berusten op het aangeboden materiaal. Zij dient dus de voorwaarden die door de rechthebbenden gesteld zijn, recht te doen. In de praktijk wordt meestal onderscheiden tussen de volgende soorten gebruikers (vgl. 1.4.): (a) Onderzoekers, particulieren en (onderwijs)instellingen die onderzoek doen of anderszins gebruikmaken van TST-materialen zonder enig winstoogmerk en zonder enige commercieel denkbare toepassing die uit dat gebruik kan voortkomen. (b) Onderzoekers en instellingen die TST-materialen gebruiken ten behoeve van de ontwikkeling van commerciële toepassingen, diensten en (half)producten. In dit stadium wordt winst beoogd, maar nog niet verkregen. (c) Onderzoekers en instellingen die TST-materialen gebruiken in en voor commerciële toepassing, diensten of (half)producten. De voorwaarden waaronder een overeenkomst wordt gesloten, verschillen al naar gelang het type gebruik(er). Dit geldt zowel voor de rechthebbende die een overeenkomst sluit met de TST-centrale als intermediaire leverancier ( ) als voor de TST-centrale die een overeenkomst sluit met de gebruiker (7.7.1.). Buiten beschouwing moet hier blijven de juridisch buitengewoon gecompliceerde situatie die zich voor kan doen in geval van verwerving van TST-materialen met vele rechthebbenden, zoals complete corpora (vgl. hieronder). Complexe relaties waarvoor een juridische regeling dringend noodzakelijk is, maar die in deze Blauwdruk niet uitgewerkt kunnen worden, zijn die tussen universiteiten en bedrijfsleven, tussen tools, halfproducten en producten, tussen werknemers van een universiteit en andere werknemers. Bij voorkeur de Nederlandse Taalunie zou als intergouvernementele verdragsorganisatie in Nederland en 18

19 Vlaanderen haar binnen het project CGN opgedane expertise ook kunnen aanwenden voor genoemde domeinen. We gaan nu in op enige bijzonderheden ten aanzien van corpora en TST-software. Bij het opbouwen van een spraakcorpus zijn er vele rechthebbenden (sprekers, opnameleiders, transcribenten en vele andere medewerkers). Hun aantal kan zelfs groter zijn dan bij een gevarieerd samengesteld corpus van geschreven taal met vele tekstleveranciers. Om de logistieke problemen die gemoeid zijn met het voeren van onderhandelingen met en het contracteren van vele rechthebbenden te vergemakkelijken, is het raadzaam, waar mogelijk, de auteursrechten zoveel mogelijk in één rechtspersoon te concentreren. "Bij het ontwikkelen van nieuwe materialen is het ( ) belangrijk al bij de start van een project bindende afspraken te maken met alle eventuele rechthebbenden zodat de materialen zonder ongewenste auteursrechtelijke beperkingen kunnen worden gedistribueerd." (Bouma en Schuurman 1998: 18). Om die reden is reeds bij de start van het CGN besloten dat alle rechten op dat corpus zullen worden ondergebracht bij de Nederlandse Taalunie, die die rol zou moeten relateren aan de werking van de TST-centrale (zie 2.9. en hoofdstuk 9). Tenslotte wordt nog vermeld dat volgens ter zake deskundige juristen bij voorkeur zogenaamde aktes van rechtenoverdracht worden toegepast, indien men from scratch begint met de aanleg van een verzameling spraak. Zie verder paragraaf TST-software is net als TST-data auteursrechtelijk beschermd, maar bij de verwerving hoeft het gebruik minder vaak expliciet contractueel geregeld te worden. In het algemeen worden bij software de rechten en plichten van de gebruiker geregeld in een zogenaamde licentie. Niet-commerciële software wordt echter ook beschikbaar gesteld onder de GNU General Public Licence (GPL). De software mag dan vrijelijk worden verspreid, mits dat gebeurt met gebruikmaking van de GNU GPL. De consequentie is dat eenieder de software kan omvormen tot een commercieel product waarop dan weer wel copyright rust. De tekst van de GNU GPL-licentie is beschikbaar op Meer informatie over GNU-licenties is te vinden op Zie verder hoofdstuk Financiële aspecten Ontwikkeling van een elektronische tekstenverzameling In deze paragraaf beperken wij ons tot de directe personele en materiële kosten die gemoeid zijn met het aanleggen van een elektronische tekstenverzameling en tot een doorberekening van de afschrijving van de benodigde apparatuur. Indirecte kosten voor wat betreft huisvesting en administratieve ondersteuning blijven buiten beschouwing. Voorts gaan wij uit van het gegeven dat de TST-centrale, wier activiteiten uit publieke, academische en andere fondsen gefinancierd worden (zie hoofdstuk 9), de garantie geeft dat teksten tegen een billijk tarief toegankelijk zijn voor gebruik. Onderstaande kostenspecificatie vormt een basis voor de berekening van de totale kosten van de aanleg van een elektronische tekstenverzameling, waarbij de mate van dekking door overheid respectievelijk gebruikers buiten beschouwing gelaten wordt. Zie voor een omschrijving van de werkzaamheden verbonden aan diverse kostenposten: 2.6. en 2.7. Als directe personele kosten kunnen worden aangemerkt: Voorbereiden document Voorbereiden scanning 19

20 Voorbereiden codering Scanning en OCR Keyboarding Correctie Tekstcodering Als directe materiële kosten kunnen worden aangemerkt: Kosten van verwerving van teksten (op papier of (semi--)elektronisch beschikbaar Aankoop en ontwikkeling van applicatiesoftware Juridische kosten Als indirecte kosten kunnen worden aangemerkt: Afschrijving gebruikte apparatuur en software Materiaalopslag Beveiligingskosten Voor onvoorzien kan een opslag van 10% gehanteerd worden. Alvorens deze kosten kunnen worden verwerkt in de voorcalculatie dienen de volgende gegevens ingeschat te worden of bekend te zijn: (1) Inhoud van de totale opdracht: - Onderscheid in teksten en boeken welke bewerkt moeten worden en externe materialen. - Onderscheid in de staat waarin het materiaal zich bevindt. - Aantal pagina's per boek of tekst - Gemiddeld aantal woorden per pagina - Aantal karakters (inclusief spaties en leestekens) per woord (2) De bewerkingen die de verschillende materialen moeten ondergaan, zijn: 1. Scannen en OCR 2. Keyboarding 3. Correctie van scanning en keyboarding 4. Tekstcodering 5. Conversie extern materiaal 6. Voorbewerking van teksten rekeninghoudend met de reeds aanwezige formele kenmerken in het bestand. 7. Ontwikkeling van software 8. Controlewerkzaamheden 9. Daadwerkelijke conversie (3) Locatie(s) waar de bewerkingen zullen plaatsvinden: Extern in lageloonlanden Extern in eigen land Intern bij instelling/non-profitorganisatie (4) Een inschatting per bewerking: hoeveel karakters, woorden of pagina's per uur verwerkt kunnen worden.. 20

Maken van een woordenboek:4 hoofdfasen

Maken van een woordenboek:4 hoofdfasen Maken van een woordenboek:4 hoofdfasen 1. het maken van een concept + het testen van het concept door middel van proefartikelen hoe moet je woordenboek er inhoudelijk uitzien? 2. opbouw van een materiaalverzameling

Nadere informatie

IPR regelingen binnen het STEVIN-programma

IPR regelingen binnen het STEVIN-programma In deze figuur is getracht informatiestromen (zwarte lijnen) en de overeenkomsten die moeten worden afgesloten (oranje pijlen) naast elkaar te leggen. Binnen een STEVINproject (gesymboliseerd door het

Nadere informatie

VvL-Adviescontract voor digitale publicaties

VvL-Adviescontract voor digitale publicaties 1 VvL-Adviescontract voor digitale publicaties Adviescontract voor de digitale publicatie van een oorspronkelijk Nederlandstalig literair werk of van een Nederlandse vertaling van een literair werk Inleiding

Nadere informatie

Auteursrecht op software

Auteursrecht op software Auteursrecht op software KNX bijeenkomst 2 oktober 2012 mr. Wouter Dammers E-Mail: W.Dammers@ictrecht.nl Twitter: @WouterDammers Linked-In: https://www.linkedin.com/in/wdammers Tel: 020 66 31 941 LinkedIn

Nadere informatie

Tekst aangenomen door de plenaire vergadering. van het ontwerp van decreet

Tekst aangenomen door de plenaire vergadering. van het ontwerp van decreet ingediend op 340 (2014-2015) Nr. 3 3 juni 2015 (2014-2015) Tekst aangenomen door de plenaire vergadering van het ontwerp van decreet tot wijziging van het decreet van 27 april 2007 betreffende het hergebruik

Nadere informatie

Intellectueel eigendom en software. Voor de digitale economie

Intellectueel eigendom en software. Voor de digitale economie Intellectueel eigendom en software Voor de digitale economie Intellectueel eigendom is een verzamelnaam voor een aantal rechten op zogenaamde voortbrengselen van de menselijke geest, zoals een schilderij,

Nadere informatie

Wat is een corpus en waarvoor wordt het gebruikt?

Wat is een corpus en waarvoor wordt het gebruikt? Wat is een corpus en waarvoor wordt het gebruikt? Een corpus is een verzameling teksten of getranscribeerde geproken taal met een samenstelling en proportionering van teksttypen die geschikt is voor een

Nadere informatie

Inleiding. Strekking van de eisen

Inleiding. Strekking van de eisen Eisen voor de programmatuur die door de centrale stembureaus wordt gebruikt ten behoeve van de vaststelling van de uitslag van verkiezingen van de leden van de Tweede Kamer, de leden van het Europees parlement,

Nadere informatie

Socofi Algemene voorwaarden

Socofi Algemene voorwaarden Socofi Algemene voorwaarden Module 5: Application Service Provision / SAAS / Computerservice Socofi Weboplossingen 1. Toepasselijkheid 1.1 De ICT~Office Voorwaarden bestaan uit de module Algemeen aangevuld

Nadere informatie

Overzicht van taken en competenties. Demandmanager-rol

Overzicht van taken en competenties. Demandmanager-rol Overzicht van taken en competenties Demandmanager-rol Inhoudsopgave 1 Taakomschrijving... 2 1.1 AA-1 Goedkeuren/beoordelen opdracht, verzoek, e.d.... 2 1.2 AA-7 Evalueren opdracht... 2 1.3 CA-1 Onderhouden

Nadere informatie

eisen voor programmatuur die gebruikt wordt bij de berekening van de uitslag van verkiezingen die vallen onder de werking van de Kieswet

eisen voor programmatuur die gebruikt wordt bij de berekening van de uitslag van verkiezingen die vallen onder de werking van de Kieswet Datum 9 april 2008 Ons kenmerk BPR2008/U52926 Aan de voorzitter van de Tweede Kamer der Staten- Generaal Postbus 20018 2500 EA Den Haag Onderdeel DGKB/BPR Inlichtingen T F Uw kenmerk Onderwerp eisen voor

Nadere informatie

1.2 Afwijkingen van deze Algemene Voorwaarden zijn slechts rechtsgeldig indien deze schriftelijk zijn overeengekomen.

1.2 Afwijkingen van deze Algemene Voorwaarden zijn slechts rechtsgeldig indien deze schriftelijk zijn overeengekomen. Algemene Voorwaarden Freemle Algemeen deel 1 Toepasselijkheid 1.1 Deze Algemene Voorwaarden zijn van toepassing op alle (aanvragen tot) aanbiedingen, offertes, werkzaamheden en verlening van diensten door

Nadere informatie

Woordenboekencomponent van de Geïntegreerde Taalbank (GTB): het WNT en VMNW met andere databestanden geïntegreerd in 1 zoeksysteem demo gtb.inl.

Woordenboekencomponent van de Geïntegreerde Taalbank (GTB): het WNT en VMNW met andere databestanden geïntegreerd in 1 zoeksysteem demo gtb.inl. Woordenboekencomponent van de Geïntegreerde Taalbank (GTB): het WNT en VMNW met andere databestanden geïntegreerd in 1 zoeksysteem demo gtb.inl.nl: basiszoeken en uitgebreid zoeken links vanuit een artikel

Nadere informatie

Privacy Bijsluiter Digitale Leermiddelen Basisonderwijs (Dr. Digi), Noordhoff Uitgevers

Privacy Bijsluiter Digitale Leermiddelen Basisonderwijs (Dr. Digi), Noordhoff Uitgevers Bijlage 1 bij de Bewerkersovereenkomst Noordhoff Uitgevers Privacy Bijsluiter Digitale Leermiddelen Basisonderwijs (Dr. Digi), Noordhoff Uitgevers Noordhoff Uitgevers is een educatieve uitgeverij die verschillende

Nadere informatie

Licentievoorwaarden. Werkingssfeer:

Licentievoorwaarden. Werkingssfeer: Licentievoorwaarden Werkingssfeer: Deze voorwaarden zijn van toepassing op alle - al dan niet in deze licentievoorwaarden omschreven - aanbiedingen, werkzaamheden en alle andere transacties door natuurlijke

Nadere informatie

DISCLAIMER Dairy Training Centre

DISCLAIMER Dairy Training Centre Gebruikersvoorwaarden Voor de toegang tot en het gebruik van deze website gelden, naast de toepasselijke wet- en regelgeving, de hierna genoemde condities en bepalingen. Gebruik van deze website betekent

Nadere informatie

Gebruikersovereenkomst

Gebruikersovereenkomst Nieuwland GEO-Informatie, H. v. Suchtelenweg 4, Postbus 522, 6700 AM Wageningen, t: 0317 421711 http://geo.nieuwland.nl Gebruikersovereenkomst Nieuwland E-learning Versie 1.0 20 juni 2012 Inhoud 1a. E-learning...

Nadere informatie

Sectoraal Comité van de Sociale Zekerheid en van de Gezondheid Afdeling «Sociale Zekerheid»

Sectoraal Comité van de Sociale Zekerheid en van de Gezondheid Afdeling «Sociale Zekerheid» Sectoraal Comité van de Sociale Zekerheid en van de Gezondheid Afdeling «Sociale Zekerheid» SCSZG/15/192 ADVIES NR 15/56 VAN 3 NOVEMBER 2015 BETREFFENDE DE AANVRAAG VAN HET NATIONAAL ZIEKENFONDS PARTENA

Nadere informatie

Project Fasering Documentatie Applicatie Ontwikkelaar

Project Fasering Documentatie Applicatie Ontwikkelaar Project Fasering Documentatie Applicatie Ontwikkelaar Auteurs: Erik Seldenthuis Aminah Balfaqih Datum: 31 Januari 2011 Kerntaak 1 Ontwerpen van applicaties De volgordelijke plaats van de documenten binnen

Nadere informatie

PROCEDURES BETREFFENDE DE VERWERVING DOOR HET EUROPEES PARLEMENT VAN PRIVEARCHIEVEN VAN LEDEN EN VOORMALIGE LEDEN

PROCEDURES BETREFFENDE DE VERWERVING DOOR HET EUROPEES PARLEMENT VAN PRIVEARCHIEVEN VAN LEDEN EN VOORMALIGE LEDEN 2.2.8. PROCEDURES BETREFFENDE DE VERWERVING DOOR HET EUROPEES PARLEMENT VAN PRIVEARCHIEVEN VAN LEDEN EN VOORMALIGE LEDEN BESLUIT VAN HET BUREAU VAN 10 MAART 2014 HET BUREAU VAN HET EUROPEES PARLEMENT,

Nadere informatie

Algemene Voorwaarden Jortt BV

Algemene Voorwaarden Jortt BV Algemene Voorwaarden Jortt BV 1 Toepasselijkheid 1.1 Deze Algemene Voorwaarden zijn van toepassing op alle (aanvragen tot) aanbiedingen, offertes, werkzaamheden en verlening van diensten door en overeenkomsten

Nadere informatie

Formulier Datamanagementplan

Formulier Datamanagementplan Formulier Datamanagementplan NWO is in 2015 gestart met een pilot Datamanagement. Tijdens deze pilot vraagt NWO onderzoekers met toegekende onderzoeksprojecten onderstaand datamanagementplan in te dienen.

Nadere informatie

Ontwikkelaar ICT. Context. Doel

Ontwikkelaar ICT. Context. Doel Ontwikkelaar ICT Doel Ontwikkelen en ontwerpen van ICT-producten, binnen overeen te komen dan wel in een projectplan vastgelegde afspraken ten aanzien van tijd, budget en kwaliteit, opdat overeenkomstig

Nadere informatie

Privacy Verklaring Definities Toegang tot Innerview

Privacy Verklaring Definities Toegang tot Innerview Privacy Verklaring Dit is de Privacy Verklaring van Pearson Assessment and Information B.V. (hierna te noemen: Pearson of wij ) te Amsterdam (Postbus 78, 1000 AB). In deze verklaring wordt uiteengezet

Nadere informatie

GEHEIMHOUDINGSOVEREENKOMST

GEHEIMHOUDINGSOVEREENKOMST GEHEIMHOUDINGSOVEREENKOMST de ondergetekenden: (bedrijfs)naam: naam vertegenwoordiger bedrijf: straatnaam en huisnummer: postcode: plaats: KvK-nummer:. nummer:. hierna te noemen: Geheimhouder en (bedrijfs)naam:

Nadere informatie

ICT Beheermodel informatiesystemen Drechtsteden Baseline inrichting ICT beheermodel Drechtsteden

ICT Beheermodel informatiesystemen Drechtsteden Baseline inrichting ICT beheermodel Drechtsteden Drechtsteden Technische Architectuur (DTA) ICT Beheermodel informatiesystemen Drechtsteden Baseline inrichting ICT beheermodel Drechtsteden Status : Definitief 1.0 Redactie : DTA Datum : 29-08-2007 1 Versiebeheer

Nadere informatie

OVEREENKOMST. 1. de publiekrechtelijke bedrijfsorganisatie Bedrijfschap Horeca en Catering, waarvan de zetel is

OVEREENKOMST. 1. de publiekrechtelijke bedrijfsorganisatie Bedrijfschap Horeca en Catering, waarvan de zetel is OVEREENKOMST DE ONDERGETEKENDEN: 1. de publiekrechtelijke bedrijfsorganisatie Bedrijfschap Horeca en Catering, waarvan de zetel is gevestigd te Zoetermeer (hierna: BHC ), ten deze rechtsgeldig vertegenwoordigd

Nadere informatie

Notitie Detachering aan derden Publicatie 15 april 2016

Notitie Detachering aan derden Publicatie 15 april 2016 Toelichting Deze notitie heeft de status van een inlichting/algemene voorlichting, omdat geen specifieke casuïstiek aan de orde komt. De notitie beoogt de overheidslichamen te ondersteunen bij het beoordelen

Nadere informatie

Open Data. Themamiddag Actieve Openbaarheid

Open Data. Themamiddag Actieve Openbaarheid Open Data Themamiddag Actieve Openbaarheid Open Data Middag Actieve Openbaarheid 11 februari 2016 Agenda Wat is open data + wet- en regelgeving Beleid Open Data Nationaal Archief Hoe is het Nationaal Archief

Nadere informatie

Service Level Agreement (SLA)

Service Level Agreement (SLA) Service Level Agreement (SLA) Marcel Spruit Wat is een SLA Een SLA (Service Level Agreement) is een schriftelijke overeenkomst tussen een aanbieder en een afnemer van bepaalde diensten. In een SLA staan,

Nadere informatie

SBS BROADCASTING B.V. ALGEMENE VOORWAARDEN PROGRAMMA PARTICIPATIE 2015. Inhoudsopgave

SBS BROADCASTING B.V. ALGEMENE VOORWAARDEN PROGRAMMA PARTICIPATIE 2015. Inhoudsopgave Kijk voor meer informatie op: WWW.ADVERTERENBIJSBS.NL SBS BROADCASTING B.V. ALGEMENE VOORWAARDEN PROGRAMMA PARTICIPATIE 2015 Inhoudsopgave 1. Het Programma 2. Participatie aan het Programma 3. Productie

Nadere informatie

LICENTIEOVEREENKOMST

LICENTIEOVEREENKOMST LICENTIEOVEREENKOMST Ondergetekenden: 1. [NAAM ARCHITECT(ENBUREAU)], geboren op [ ] te [ ], wonende te [ ] aan de [ ]/ gevestigd en kantoorhoudende aan de [ ] te [ ], (ten deze rechtsgeldig vertegenwoordigd

Nadere informatie

Deze PowerPoint is bedoeld voor het onderwijs. Alle informatie in deze Powerpoint, in welke vorm dan ook (teksten, afbeeldingen, animaties,

Deze PowerPoint is bedoeld voor het onderwijs. Alle informatie in deze Powerpoint, in welke vorm dan ook (teksten, afbeeldingen, animaties, Deze PowerPoint is bedoeld voor het onderwijs. Alle informatie in deze Powerpoint, in welke vorm dan ook (teksten, afbeeldingen, animaties, geluidsfragmenten e.d.) is eigendom van ThiemeMeulenhoff, tenzij

Nadere informatie

Openbare licentie van de Europese Unie

Openbare licentie van de Europese Unie Openbare licentie van de Europese Unie V.1.1 EUPL Europese Gemeenschap 2007 Deze openbare licentie van de Europese Unie ( EUPL ) 1 is van toepassing op het werk of de software zoals hieronder gedefinieerd,

Nadere informatie

ABONNEMENTSVOORWAARDEN BOUW!

ABONNEMENTSVOORWAARDEN BOUW! Definities De in de algemene voorwaarden met een beginhoofdletter aangeduide begrippen hebben de volgende betekenis: Abonnementsovereenkomst: de overeenkomst volgens welke Lexima tegen betaling het gebruik

Nadere informatie

NEDERLANDS PATENT IN 6 STAPPEN

NEDERLANDS PATENT IN 6 STAPPEN NEDERLANDS PATENT IN 6 STAPPEN www.inaday.eu WIJ ZIJN INADAY, SPECIALIST IN MERKEN & PATENTEN Inaday maakt merk- en patentbescherming begrijpelijk en bereikbaar. Dit doen we door de procedures voor merk-

Nadere informatie

Nieuwsflits praktijkgroep Technologie, Media en Entertainment

Nieuwsflits praktijkgroep Technologie, Media en Entertainment Nieuwsflits praktijkgroep Technologie, Media en Entertainment Geachte heer, mevrouw, Hierbij ontvangt u de 3 e nieuwsflits van onze praktijkgroep Technologie, Media en Entertainment. Met deze digitale

Nadere informatie

Medewerker audiovisuele technieken (regie)

Medewerker audiovisuele technieken (regie) technieken (regie) Doel (Regisseren van het) vervaardigen van (audio)visuele en/of multimedia producties, alsmede terzake adviseren van opdrachtgevers en begeleiden van externe uitvoerders, teneinde een

Nadere informatie

Gedragscode voor Onderzoek & Statistiek. Gedragscode op basis van artikel 25 Wet bescherming persoonsgegevens

Gedragscode voor Onderzoek & Statistiek. Gedragscode op basis van artikel 25 Wet bescherming persoonsgegevens Gedragscode voor Onderzoek & Statistiek Gedragscode op basis van artikel 25 Wet bescherming persoonsgegevens Inhoudsopgave 1. Considerans...3 2. Begripsbepaling...3 3. Omschrijving van de sector en toepassingsgebied...4

Nadere informatie

Convenant Eenvormige Toetsing Gezondheidsonderzoek vanuit het Parelsnoer Instituut

Convenant Eenvormige Toetsing Gezondheidsonderzoek vanuit het Parelsnoer Instituut Convenant Eenvormige Toetsing Gezondheidsonderzoek De ondergetekenden: 1. Academisch Medisch Centrum Amsterdam... gevestigd aan... te..., vertegenwoordigd door... (hierna te noemen...) en 2...., gevestigd

Nadere informatie

CAG/13/12.12/DOC.104 bijlage 1

CAG/13/12.12/DOC.104 bijlage 1 Modellicenties voor open data Versie 1.1 CAG/13/12.12/DOC.104 bijlage 1 Licentiemodellen open data v1.1 2 Inleiding In deze nota worden een aantal modellicenties voorgesteld voor het ter beschikking stellen

Nadere informatie

Juridische valkuilen bij cloud computing

Juridische valkuilen bij cloud computing Juridische valkuilen bij cloud computing De drie belangrijkste juridische risico s bij cloud computing Cloud computing is geen zelfstandige nieuwe technologie, maar eerder een service delivery framework

Nadere informatie

Aanvullende voorwaarden bij interactieve ontwerpen

Aanvullende voorwaarden bij interactieve ontwerpen Aanvullende voorwaarden bij interactieve ontwerpen Onze overeenkomst De overeenkomst tussen Opdrachtgever en Zuiderlicht is definitief na ondertekening van de offerte. In deze offerte staat een zo compleet

Nadere informatie

Kosten indicatoren / Begrotingen

Kosten indicatoren / Begrotingen Kosten indicatoren / Begrotingen Totaal begroting NIvO Projectbegroting database en website 'Het digitale orgelplatform in Nederland' Periode Ontwikkelingskosten Totalen Stappen Totalen per stap 1 database-ontwerp

Nadere informatie

Gedragscode Fondsenwerving

Gedragscode Fondsenwerving Gedragscode Fondsenwerving Inleiding Financiering van de Vereniging VGnetwerken vindt plaats langs vier hoofdstromen: 1. structurele financiering (subsidiëring) vanuit de overheid, bedoeld voor de instandhouding

Nadere informatie

Resultaten en Beschikbaarheid 1e Ronde projecten, SPRAAK en CORNETTO Jan Odijk i.s.m. TST-Centrale

Resultaten en Beschikbaarheid 1e Ronde projecten, SPRAAK en CORNETTO Jan Odijk i.s.m. TST-Centrale Resultaten en Beschikbaarheid 1e Ronde projecten, SPRAAK en CORNETTO Jan Odijk i.s.m. TST-Centrale STEVIN Programmabijeenkomst, Hoeven, 11 september 2008 Autonomata COREA D-Coi IRME JASMIN-CGN SPRAAK CORNETTO

Nadere informatie

Plan van aanpak. Project : Let s Drop. Bedrijf : DropCo BV

Plan van aanpak. Project : Let s Drop. Bedrijf : DropCo BV Plan van aanpak Project : Let s Drop Bedrijf : DropCo BV Plaats, datum: Horn, 28 september 2012 Opgesteld door: 1205366 1205366smit@zuyd.nl Plan van Aanpak project Let s Drop pagina 1 Inhoudsopgave plan

Nadere informatie

Nulmeting van de e-depotvoorziening van het Noord-Hollands Archief aan de hand van het toetsingskader ED3

Nulmeting van de e-depotvoorziening van het Noord-Hollands Archief aan de hand van het toetsingskader ED3 Nulmeting van de e-depotvoorziening van het Noord-Hollands Archief aan de hand van het toetsingskader ED3 Pilot Uitplaatsing digitaal archief gemeente Haarlem Auteur: Noord-Hollands Archief: Stinie Francke

Nadere informatie

Sectoraal Comité van de Sociale Zekerheid en van de Gezondheid Afdeling «Sociale Zekerheid»

Sectoraal Comité van de Sociale Zekerheid en van de Gezondheid Afdeling «Sociale Zekerheid» Sectoraal Comité van de Sociale Zekerheid en van de Gezondheid Afdeling «Sociale Zekerheid» SCSZ/11/135 ADVIES NR 11/16 VAN 8 NOVEMBER 2011 BETREFFENDE DE AANVRAAG VAN HET NATIONAAL ZIEKENFONDS PARTENA

Nadere informatie

van onderwijs en onderwijsondersteuning binnen Directeur onderwijsinstituut

van onderwijs en onderwijsondersteuning binnen Directeur onderwijsinstituut Opleidingsmanager Doel Ontwikkelen van programma( s) van wetenschappenlijk onderwijs en (laten) uitvoeren en organiseren van onderwijs en onderwijsondersteuning binnen de faculteit, uitgaande van een faculteitsplan

Nadere informatie

Hoofdlijnen van beleid management onderzoeksdata Universiteit voor Humanistiek

Hoofdlijnen van beleid management onderzoeksdata Universiteit voor Humanistiek 1 november 2016 Hoofdlijnen van beleid management onderzoeksdata Universiteit voor Humanistiek Preambule In deze notitie wordt op hoofdlijnen vastgelegd hoe onderzoeksdata moet worden beheerd. Het is van

Nadere informatie

Overeenkomst: de overeenkomst van opdracht tussen Fotograaf en Opdrachtgever.

Overeenkomst: de overeenkomst van opdracht tussen Fotograaf en Opdrachtgever. Schoonderwoert Fotografie Breda KvK 65039807 Versie Januari 2016 Artikel 1. Definities In deze algemene voorwaarden wordt verstaan onder: Offerte: alle aanbiedingen van fotograaf aan (rechts)personen waarmee

Nadere informatie

Oplossingsvrij specificeren

Oplossingsvrij specificeren Oplossingsvrij specificeren ir. J.P. Eelants, projectmanager Infrabouwproces CROW Samenvatting De methodiek van oplossingsvrij specificeren richt zich niet alleen op het formuleren van functionele eisen.

Nadere informatie

Licentieovereenkomst ADLIB

Licentieovereenkomst ADLIB Licentieovereenkomst ADLIB De Ondergetekenden: a. ADLIB INFORMATION SYSTEMS B.V., kantoorhoudende te Maarssen, aan de Safariweg 18-22, vertegenwoordigd door mevrouw M. van der Kwartel, Financieel Directeur,

Nadere informatie

Directeur onderzoeksinstituut

Directeur onderzoeksinstituut Directeur onderzoeks Doel College van van Bestuur Zorgdragen voor de ontwikkeling van het van het en uitvoering en organisatie van onderzoek en onderzoeksondersteuning binnen het, uitgaande van het faculteitsplan

Nadere informatie

LICENTIEOVEREENKOMST/VOORWAARDEN

LICENTIEOVEREENKOMST/VOORWAARDEN LICENTIEOVEREENKOMST/VOORWAARDEN De ondergetekenden: 1. Licentiegever; en 2. de besloten vennootschap ilearn Company B.V, gevestigd en kantoorhoudende te Ede, aan de Wiek 121, in deze rechtsgeldig vertegenwoordigd

Nadere informatie

Subsidiebeleid Stichting Zorg en Zekerheid

Subsidiebeleid Stichting Zorg en Zekerheid SUBSIDIEBELEID 2014 oktober 2013 Inhoudsopgave 1 Inleiding... 3 2 Thema s... 4 2.1 Preventie... 4 2.2 Ouderenzorg... 5 2.3 Mantelzorg/vrijwilligerswerk... 5 2.4 Daarnaast kunnen projectvoorstellen ingestuurd

Nadere informatie

In 8 stappen naar bedrijfskundig FM. Van FM-specialist tot strategisch businesspartner

In 8 stappen naar bedrijfskundig FM. Van FM-specialist tot strategisch businesspartner In 8 stappen naar bedrijfskundig FM Van FM-specialist tot strategisch businesspartner Inhoud STAP 1. Maak een businessplan voor FM STAP 2. Zorg voor een optimale werkomgeving STAP 3. Zorg voor een flexibele

Nadere informatie

Intentieverklaring Het Betrouwbare Afrekensysteem

Intentieverklaring Het Betrouwbare Afrekensysteem Intentieverklaring Het Betrouwbare Afrekensysteem 1. Preambule Leveranciers en Producenten van Afrekensystemen (hierna: Marktpartijen, zie ook bijlage 1 voor definities) en de Belastingdienst, (hierna

Nadere informatie

GEBRUIKSVOORWAARDEN THE SIRIUS PROGRAM. Versie d.d. 12 april 2015.

GEBRUIKSVOORWAARDEN THE SIRIUS PROGRAM. Versie d.d. 12 april 2015. GEBRUIKSVOORWAARDEN THE SIRIUS PROGRAM Versie d.d. 12 april 2015. In deze eindgebruikersvoorwaarden staan de voorwaarden waaronder The Space Project BV als aanbieder van The Sirius Program (hierna: 'TSP')

Nadere informatie

Functieprofiel: Medewerker Marketing en Communicatie Functiecode: 0602

Functieprofiel: Medewerker Marketing en Communicatie Functiecode: 0602 Functieprofiel: Communicatie Functiecode: 0602 Doel Verzorgen van activiteiten op het gebied van communicatie en/of voorlichting voor Hogeschool Utrecht of onderdelen daarvan, aan verschillende in- en

Nadere informatie

Beoordelingscriteria scriptie Nemas HRM

Beoordelingscriteria scriptie Nemas HRM Beoordelingscriteria scriptie Nemas HRM Instructie Dit document hoort bij het beoordelingsformulier. Op het beoordelingsformulier kan de score per criterium worden ingevuld. Elk criterium kan op vijf niveaus

Nadere informatie

Contractmanagement en contractbeheer

Contractmanagement en contractbeheer Ir. ing. D. Mostert, DME Advies If you are not in control of your contracts, you are not in control of your business (Gartner) Uitbesteding op diverse gebieden neemt een grote vlucht. Steeds vaker wordt

Nadere informatie

Handleiding Geogedeeld licentiegenerator v1.0

Handleiding Geogedeeld licentiegenerator v1.0 Handleiding Geogedeeld licentiegenerator v1.0 Datum: 22 september 2015 Versie: 0.3 Wijzigingsbeheer Revisiehistorie document: Versie Datum Status Auteur Omschrijving V0.1 7-4-2011 Concept Michel Grothe

Nadere informatie

Nota collectiebeleid 2011 De collectievorming voor de Vakbibliotheek Rechten

Nota collectiebeleid 2011 De collectievorming voor de Vakbibliotheek Rechten Nota collectiebeleid 2011 De collectievorming voor de Vakbibliotheek Rechten Inhoud: 1. Inleiding 2. Collectievorming en taakstelling van de vakbibliotheek 2.1. De taakstelling van de bibliotheek 2.2.

Nadere informatie

Voorwaarden Repper-account

Voorwaarden Repper-account Voorwaarden Repper-account Versie 1 3 2014 Toepasselijkheid 1. De bepalingen in deze overeenkomst zijn onlosmakelijk verbonden met de algemene voorwaarden van leverancier. Bij tegenstrijdigheid tussen

Nadere informatie

Uitwerking onderdelen werkplan

Uitwerking onderdelen werkplan Uitwerking onderdelen werkplan Het Nationaal Platform Data Model (NPDM) heeft een werkplan opgesteld om richting te geven aan de activiteiten voor de komende maanden en inzicht te krijgen in de benodigde

Nadere informatie

Modellicenties Open Data. http://www.vlaanderen.be/opendata info@opendataforum.info Skype: opendataforum_ LinkedIn: Open Data Group

Modellicenties Open Data. http://www.vlaanderen.be/opendata info@opendataforum.info Skype: opendataforum_ LinkedIn: Open Data Group Modellicenties Open Data http://www.vlaanderen.be/opendata info@opendataforum.info Skype: opendataforum_ LinkedIn: Open Data Group INLEIDING In deze nota worden een aantal modellicenties voorgesteld voor

Nadere informatie

Privacy Verklaring versie 01-10-2015

Privacy Verklaring versie 01-10-2015 Privacy Verklaring versie 01-10-2015 1. Algemene bepalingen inzake gegevensverwerking 1.1. Met gegevensverwerking wordt het verzamelen, vastleggen, arrangeren, bewaren, wijzigen, openbaar maken, overleggen,

Nadere informatie

!!! Amsterdam,!oktober!2015!! Betreft:!Concept!escrow!overeenkomsten!Escrow4all! Geachte!heer!/!mevrouw,!

!!! Amsterdam,!oktober!2015!! Betreft:!Concept!escrow!overeenkomsten!Escrow4all! Geachte!heer!/!mevrouw,! Amsterdam,oktober2015 Betreft:ConceptescrowovereenkomstenEscrow4all Geachteheer/mevrouw, HartelijkdankvooruwinteresseindeescrowoplossingenvanEscrow4all. Alskennisleiderindebranche,helpenwijugraageenescrowoplossingteselecterenofsamentestellen

Nadere informatie

1. Offerte: alle aanbiedingen van fotograaf aan (rechts)personen waarmee beoogd wordt een overeenkomst aan te gaan.

1. Offerte: alle aanbiedingen van fotograaf aan (rechts)personen waarmee beoogd wordt een overeenkomst aan te gaan. Artikel 1. Definities In deze algemene voorwaarden wordt verstaan onder: 1. Offerte: alle aanbiedingen van fotograaf aan (rechts)personen waarmee beoogd wordt een overeenkomst aan te gaan. 2. Overeenkomst:

Nadere informatie

PARTNEROVEREENKOMST. De ondergetekenden:

PARTNEROVEREENKOMST. De ondergetekenden: PARTNEROVEREENKOMST De ondergetekenden: 1. De besloten vennootschap 2Value B.V., handelend onder de naam 2Value, kantoorhoudende te (2106 AP) Heemstede aan de Zandvoortselaan nr. 190, ingeschreven in het

Nadere informatie

Functieprofiel: Manager Functiecode: 0202

Functieprofiel: Manager Functiecode: 0202 Functieprofiel: Manager Functiecode: 0202 Doel Zorgdragen voor de vorming van beleid voor de eigen functionele discipline, alsmede zorgdragen voor de organisatorische en personele aansturing van een of

Nadere informatie

Wijziging van de Auteurswet en de Wet op de naburige rechten in verband met de aanpassing van het auteurscontractenrecht

Wijziging van de Auteurswet en de Wet op de naburige rechten in verband met de aanpassing van het auteurscontractenrecht Wijziging van de Auteurswet en de Wet op de naburige rechten in verband met de aanpassing van het auteurscontractenrecht ARTIKEL I De Auteurswet wordt als volgt gewijzigd: Tekst voorontwerp Artikel 2 1.

Nadere informatie

In deze Algemene Voorwaarden wordt verstaan onder:

In deze Algemene Voorwaarden wordt verstaan onder: Cremerstraat 132 3532 BJ Utrecht M: +31 (0)6 24231170 E: geertje@geertjealgeramedia.nl www.geertjealgeramedia.nl linkedin.com/in/geertjealgera @geertjealgeramedia @geertjealgeramedia @missgeertje @missgeertje

Nadere informatie

Plan 5 6-11 7 - 41-43 76-78

Plan 5 6-11 7 - 41-43 76-78 Plan Gegevens mag het? Rechtmatig verkregen gegevens grondslagen voor rechtmatige verwerking: Ondubbelzinnige toestemming, noodzakelijk voor uitvoeren overeenkomst, wettelijke plicht, bescherming vitale

Nadere informatie

Privacyreglement

Privacyreglement Privacyreglement De Verwerking van Persoonsgegevens is aangemeld bij het College Bescherming Persoonsgegevens (CBP) onder nummer m1602696. Persoonsgegevens in een vorm die het mogelijk maakt de Betrokkene

Nadere informatie

Auteursrecht en STABU. STABU Bezoekadres: Telefoonweg 32 Postbus 36 6712 GC EDE. Tel. 0318 63 30 26 E-mail: info@stabu.nl Website: www.stabu.

Auteursrecht en STABU. STABU Bezoekadres: Telefoonweg 32 Postbus 36 6712 GC EDE. Tel. 0318 63 30 26 E-mail: info@stabu.nl Website: www.stabu. Auteursrecht en STABU STABU Bezoekadres: Telefoonweg 32 Postbus 36 6712 GC EDE Tel. 0318 63 30 26 E-mail: info@stabu.nl Website: www.stabu.org In het kort: De bouwwereld is constant aan veranderingen onderhevig

Nadere informatie

/// Gebruiksvoorwaarden en -bepalingen Digitaal Hoogtemodel Vlaanderen II, DTM, raster, 5m, testdata

/// Gebruiksvoorwaarden en -bepalingen Digitaal Hoogtemodel Vlaanderen II, DTM, raster, 5m, testdata /// Gebruiksvoorwaarden en bepalingen Digitaal Hoogtemodel Vlaanderen II, DTM, raster, 5m, testdata Voor taken van algemeen belang GDIVlaanderen deelnemers Elke deelnemer aan GDIVlaanderen heeft toegang

Nadere informatie

Prijzen RIVOS. RIVOS Prijzen Pagina 1

Prijzen RIVOS. RIVOS Prijzen Pagina 1 Prijzen RIVOS De totale investering voor RIVOS bestaat uit de basis aanschafprijs, optionele modules, bijkomende kosten en jaarlijks terugkerende kosten. De basis aanschafprijs wordt bepaald door het aantal

Nadere informatie

ALGEMENE VOORWAARDEN AGILE MARKETING AGENCY. 1. Definities/begripsbepalingen. Agile Marketing Agency: Agile Marketing Agency B.V.,

ALGEMENE VOORWAARDEN AGILE MARKETING AGENCY. 1. Definities/begripsbepalingen. Agile Marketing Agency: Agile Marketing Agency B.V., ALGEMENE VOORWAARDEN AGILE MARKETING AGENCY 1. Definities/begripsbepalingen Agile Marketing Agency: Agile Marketing Agency B.V., Klant: Elk natuurlijk of rechtspersoon aan wie Agile Marketing Agency een

Nadere informatie

Integraal Kostenmodel voor het voeren van digitale dossiers in de JGZ

Integraal Kostenmodel voor het voeren van digitale dossiers in de JGZ Integraal Kostenmodel voor het voeren van digitale dossiers in de JGZ Voorwoord Deze handreiking behoort tot de reeks handreikingen die worden samengesteld ten behoeve van de verwerving en implementatie

Nadere informatie

Algemene voorwaarden Ruimtes in Beeld. 1. Definities. 2. Toepassing. 3. Offerte. 4. Vergoeding

Algemene voorwaarden Ruimtes in Beeld. 1. Definities. 2. Toepassing. 3. Offerte. 4. Vergoeding Algemene voorwaarden Ruimtes in Beeld 1. Definities In deze Algemene Voorwaarden wordt verstaan onder: Aw: Auteurswet 1912 Fotografisch werk: fotografische werken zoals bedoeld in artikel 10 lid 1 sub

Nadere informatie

GEBRUIKERSOVEREENKOMST Versie 2.0 1 december 2011

GEBRUIKERSOVEREENKOMST Versie 2.0 1 december 2011 GEBRUIKERSOVEREENKOMST Versie 2.0 1 december 2011 Door het downloaden, installeren en/of gebruik van de Reisplanner Xtra Software of een deel daarvan, gaat Gebruiker akkoord met alle onderstaande voorwaarden

Nadere informatie

MPARE Gebruikersvoorwaarden App. Arnhem, 21 maart 2014

MPARE Gebruikersvoorwaarden App. Arnhem, 21 maart 2014 MPARE Gebruikersvoorwaarden App Arnhem, 21 maart 2014 Deze Gebruikersvoorwaarden ("Gebruikersvoorwaarden") beschrijven de voorwaarden waaronder gebruik mag worden gemaakt van de (mobiele) applicaties ("App")

Nadere informatie

Functieprofiel: Medewerker Repro Functiecode: 0703

Functieprofiel: Medewerker Repro Functiecode: 0703 Functieprofiel: Medewerker Repro Functiecode: 0703 Doel Voorbereiden, produceren en afwerken van reproproducten, binnen de technische mogelijkheden en conform de klantvraag, teneinde te voldoen aan de

Nadere informatie

De Algemene Voorwaarden van Ontwerpburo Lichting98

De Algemene Voorwaarden van Ontwerpburo Lichting98 De Algemene Voorwaarden van Ontwerpburo Lichting98 De Algemene Voorwaarden van Ontwerpburo Lichting98 zijn van toepassing op de totstandkoming, de inhoud en de nakoming van alle tussen de opdrachtgever

Nadere informatie

Algemene Voorwaarden

Algemene Voorwaarden Henri Dunantplein 17 KvK 61258016 5961HK Horst IBAN NL 86 INGB 0002 2010 51 +31 (0)6 27 34 46 45 BTW nr NL203159755B01 www.morrisjacobsfotografie.nl info@morrisjacobsfotografie.nl Algemene Voorwaarden

Nadere informatie

Bijlage 1. Specificaties Leesvormen I. Gesproken Documenten I.1 Productbeschrijving Gesproken documenten Gesproken Documenten zijn documenten die zijn omgewerkt naar een gesproken vorm door voorlezing

Nadere informatie

QUBE ICT Solutions B.V. voorwaarden

QUBE ICT Solutions B.V. voorwaarden QUBE ICT Solutions B.V. voorwaarden Module 3 Onderhoud van programmatuur De QUBE ICT Solutions B.V. voorwaarden zijn gedeponeerd bij de Kamer van Koophandel Hoofddorp onder nummer 34092244 1. Toepasselijkheid

Nadere informatie

. hierbij rechtsgeldig vertegenwoordigd door.., hierna te noemen: Licentienemer

. hierbij rechtsgeldig vertegenwoordigd door.., hierna te noemen: Licentienemer LICENTIEOVEREENKOMST De ondergetekenden: Bureau De Mat Training & Opleiding BV, Siegersteeg 3, 3034 TJ Vilsteren hierbij rechtsgeldig vertegenwoordigd door Milou Stockmann, hierna genoemd Licentiegever,

Nadere informatie

Levenscyclusanalyse voor onderzoekers, ontwerpers en beleidsmakers

Levenscyclusanalyse voor onderzoekers, ontwerpers en beleidsmakers Levenscyclusanalyse voor onderzoekers, ontwerpers en beleidsmakers Levenscyclusanalyse voor onderzoekers, ontwerpers en beleidsmakers R.M. Bras-Klapwijk R. Heijungs P. van Mourik 5-8 Ten geleide Voorwoord

Nadere informatie

Algemene Voorwaarden 2017/2018

Algemene Voorwaarden 2017/2018 Algemene Voorwaarden 2017/2018 Lisa Muller Fotografie Pinksterbloem Erf 12 1706 AG Heerhugowaard 06-24809726 lisamullerfotografie@gmail.com Kamer van Koophandel 56715331 IBAN NL 38 INGB 0677954646 BTWNL

Nadere informatie

Acquisitiebeleidsplan Noord-Hollands Archief 2015-2020

Acquisitiebeleidsplan Noord-Hollands Archief 2015-2020 Acquisitiebeleidsplan Noord-Hollands Archief 2015-2020 Maart 2015 Het Noord-Hollands Archief wil fungeren als het geheugen van de provincie Noord-Holland en de aangesloten gemeenten in Kennemerland en

Nadere informatie

BESLUIT. Zaaknummer: 77 Fiscaal up to Date/Kluwer. Inleiding

BESLUIT. Zaaknummer: 77 Fiscaal up to Date/Kluwer. Inleiding BESLUIT Besluit van de directeur-generaal van de Nederlandse mededingingsautoriteit om geen toepassing te geven aan zijn bevoegdheid zoals beschreven in artikel 56, lid 1, van de Mededingingswet. Zaaknummer:

Nadere informatie

De hierna en hiervoor in deze Bewerkingsovereenkomst vermelde, met een hoofdletter geschreven begrippen, hebben de volgende betekenis:

De hierna en hiervoor in deze Bewerkingsovereenkomst vermelde, met een hoofdletter geschreven begrippen, hebben de volgende betekenis: 1 De ondergetekenden: 1. De Staat der Nederlanden, waarvan de zetel is gevestigd te Den Haag, te dezen vertegenwoordigd door de Minister/Staatssecretaris van (naam portefeuille), namens deze, (functienaam

Nadere informatie

Research & development

Research & development Research & development Publishing on demand Workflow ondersteuning Typesetting Documentproductie Gespecialiseerd document ontwerp Web ontwerp en onderhoud Conversie Database publishing Advies Organisatie

Nadere informatie

Digitale cultuur als continuüm

Digitale cultuur als continuüm Digitale cultuur als continuüm Samenvatting Activiteitenplan 2017-2020 Stichting Digitaal Erfgoed Nederland (DEN) Den Haag, 31 januari 2016 1/5 1. Vooraf Deze samenvatting is gebaseerd op de subsidieaanvraag

Nadere informatie

Patiënt Intelligence Panel Limited ("wij", "ons" of "onze") is toegewijd aan het beschermen en respecteren van uw privacy.

Patiënt Intelligence Panel Limited (wij, ons of onze) is toegewijd aan het beschermen en respecteren van uw privacy. Patiënt Intelligence Panel Limited, Privacy Policy 1 Inleiding Patiënt Intelligence Panel Limited ("wij", "ons" of "onze") is toegewijd aan het beschermen en respecteren van uw privacy. Dit privacy-beleid

Nadere informatie

Competenties Luuk van Paridon. Analyseren

Competenties Luuk van Paridon. Analyseren Competenties Luuk van Paridon Overzicht waar ik nu sta: Afbeelding 1: Spinnenweb competenties De groene lijn geeft aan welke competenties ik tot nu toe behaald heb (zie Afbeelding 1). De competenties die

Nadere informatie