Altijd naar het noorden Gebruik en functie van namen in Boven is het stil van Gerbrand Bakker



Vergelijkbare documenten
Altijd naar het noorden. De (on)mogelijkheden van een kwantitatieve stilistische analyse van namen in moderne romans

Vergelijkende literaire onomastiek

de aanbieding reclame, korting De appels zijn in de a Ze zijn vandaag extra goedkoop.

Zit de online burger wel online op u te wachten? Door: David Kok

Ria Massy. De taart van Tamid

1. Joris. Voor haar huis remt Roos. Ik ben er. De gordijnen beneden zijn weer dicht.

gegevens analyseren Welk onderzoekmodel gebruik je? Quasiexperiment ( 5.5) zonder controle achtergronden

VOORBEREIDING OP BEZOEK AAN DE MUSICAL SOLDAAT VAN ORANJE. Een project over Soldaat van Oranje kan uit verschillende onderdelen bestaan :

Voorwoord. 15 miljoen mensen Op dat hele kleine stukje aarde Die moeten niet t keurslijf in Die laat je in hun waarde

Samenvatting. VS De Lans/ Brummen. Resultaten Oudertevredenheidspeiling (OTP) VS De Lans. Ouders vinden 'Sfeer' op school het belangrijkst

Aantal naamdragers Aantal naamdragers per geboortegemeente in Aantal naamdragers per gemeente in 2007

BS De Horizon/ Grashoek Samenvatting Resultaten Oudertevredenheidspeiling (OTP) BS De Horizon Ouders vinden 'Begeleiding' op school het belangrijkst

Doorbreek je belemmerende overtuigingen!

Eerwraak. Naam: Paul Rustenhoven Klas: 4GTL1 Inlever datum : Titel: Eerwraak Schrijver: Karin Hitlerman. Blz 1.

Spotlight: Joris van Leeuwen

Schrijver: KAT Coverontwerp: MTH ISBN: <Katelyne>

Samenvatting. VS De Noorderkroon/ Enschede. Resultaten Oudertevredenheidspeiling (OTP) VS De Noorderkroon

Samenvatting. BS Benjamin/ Brunssum. Resultaten Oudertevredenheidspeiling (OTP) BS Benjamin. Ouders vinden 'Begeleiding' op school het belangrijkst

Samenvatting. BS Pius X/ Varsselder. Resultaten Oudertevredenheidspeiling (OTP) BS Pius X. Ouders vinden 'De leerkracht' op school het belangrijkst

Het LOVS rekenen-wiskunde van het Cito

Samenvatting. BS Bontebrugschool/ Silvolde. Resultaten Oudertevredenheidspeiling (OTP) BS Bontebrugschool

Samenvatting. BS De Meeander/ Locatie Heelweg. Resultaten Oudertevredenheidspeiling (OTP) Locatie Heelweg

EFFECTEN VAN DE WEEKEND- SCHOOL VAN STICHTING WITTE TULP. - eindrapport - dr. Marga de Weerd. Amsterdam, november 2009

Oud wit Prins de Vos. Ik wil je.

Kom erbij Tekst: Ron Schröder & Marianne Busser Muziek: Marcel & Lydia Zimmer 2013 Celmar Music / Schröder & Busser

Het LOVS rekenen-wiskunde van het Cito

Palliatieve Zorg. Onderdeel: Kwalitatief onderzoek. Naam: Sanne Terpstra Studentennummer: Klas: 2B2

Samenvatting. BS Beatrixschool/ Loppersum. Resultaten Oudertevredenheidspeiling (OTP) BS Beatrixschool

Jezus maakt mensen gelukkig

Het is de familieblues. Je kent dat gevoel vast wel. Je zit aan je familie vast. Voor altijd ben je verbonden met je ouders, je broers, je zussen.

Samenvatting. BS `t Ogelijn/ Boxmeer. Resultaten Oudertevredenheidspeiling (OTP) BS `t Ogelijn. Ouders vinden 'Begeleiding' op school het belangrijkst

Samenvatting. BS De Bonte Mol/ Schermerhorn. Resultaten Oudertevredenheidspeiling (OTP) BS De Bonte Mol

Op de vraag of men de artikelen zelf in het Engels schrijft, gaf één wetenschapper het volgende aan:

Verslag van een ervaringsdeskundige. Nu GAP-deskundige.

Genieten van het echte leven

Samenvatting Dautzenberg H8

Van mij. Een gezicht is geen muur. Jan Bransen, Universiteit Utrecht

Portret van H. Gerealiseerd door H. en Linde Stael In samenwerking met het SIHO

TITEL ACTIVITEIT + beschrijving: filosofisch gesprek over geloven.

Waarom mensen zich niet verdiepen in partnerpensioen

ze er iets gewichtigs mee wil aangeven, al is het nooit duidelijk haar schouders reikte, is nagenoeg gehalveerd. Een simpele

Samenvatting. BS Alexanderschool/ Denekamp. Resultaten Oudertevredenheidspeiling (OTP) BS Alexanderschool

BS De Akkerwal/ Enter Samenvatting Resultaten Oudertevredenheidspeiling (OTP) BS De Akkerwa Ouders vinden 'De leerkracht' op school het belangrijkst

Proeftuinplan: Meten is weten!

Vertrouwen. Margriet Ledin-de Hoop. Uitgeverij Boekencentrum, Zoetermeer

3 minuten: Geef een samenvatting van het verhaal. 3 minuten: Wat is jouw mening over. Onderbouw je mening.

Kwetsbaar alleen. De toename van het aantal kwetsbare alleenwonende ouderen tot 2030

Samenvatting. BS Matthias/ Alkmaar. Resultaten Oudertevredenheidspeiling (OTP) BS Matthias. Ouders vinden 'De leerkracht' op school het belangrijkst

Samenvatting. BS School 59/ Nieuw-Buinen. Resultaten Oudertevredenheidspeiling (OTP) BS School 59. Ouders vinden 'Sfeer' op school het belangrijkst

Een meneer heeft veel ballonnen. Hij roept: Kinderen, kom erbij! Mijn ballonnen die zijn gratis. Wie wil een ballon van mij?

Beoordelingscriteria scriptie Nemas HRM

Samenvatting. BS It Grovestinshôf. Resultaten Oudertevredenheidspeiling (OTP) BS It Grovestinshôf

Onderzoek in het kader van de 100 ste editie van de Internationale Vierdaagse Afstandsmarsen Nijmegen. Nienke Lammertink en Koen Breedveld

Voorwoord. Veel succes met de schrijftraining! Amsterdam, februari Freek Bakker Joke Olie. 6 Voorwoord

Verhaal: Jozef en Maria

Meer weten, minder kansen

Pasen met peuters en kleuters. Jojo is weg

Samenvatting. BS Gerardus Majella. Resultaten Oudertevredenheidspeiling (OTP) BS Gerardus Majella

Cover Page. The handle holds various files of this Leiden University dissertation.

DE INVLOED VAN GELUK, PECH, BIED- EN SPEELTECHNIEK OP DE SCORE BIJ BRIDGE

Inventarisatie enquête over het gebruik van videofragmenten bij het onderwijs van Inleiding Staats- en Bestuursrecht

6 In Beeld. Bieke Depoorter

Grafiek 26.1a Het vóórkomen van verschillende vormen van discriminatie in Leiden volgens Leidenaren, in procenten 50% 18% 19% 17% 29%

Evalueren van projecten met externen Kennisdocument Onderzoek & Statistiek

Hardell: mobiel bellen en hersentumoren aan de belzijde

Samenvatting. BS Het Kompas/ Ijmuiden. Resultaten Oudertevredenheidspeiling (OTP) BS Het Kompas

Lesbrief voor leerlingen: hoe ontwerp je een omslag voor een boek

Waaraan het vlees ontsnapt

chevy stevens bij uitgeverij cargo

Liederen solozang Prijs: 7,= euro per stuk

Samenvatting. BS Ds Derksenschool/ Ravenswaaij. Resultaten Oudertevredenheidspeiling (OTP) Ds Derksenschool

Samenvatting. BS Lucebertschool/ Bergen NH. Resultaten Oudertevredenheidspeiling (OTP) BS Lucebertschool

Aanpak van een cursus

Samenvatting. BS De Fontein/ Helden. Resultaten Oudertevredenheidspeiling (OTP) BS De Fontein. Ouders vinden 'Begeleiding' op school het belangrijkst

BS It Pertoer/ Weidum Samenvatting Resultaten Oudertevredenheidspeiling (OTP) BS It Pertoer Ouders vinden 'De leerkracht' op school het belangrijkst

Mijn dochter; boulimia en borderline

Mailwisseling Hans Baaij en Wim van den Brink

Check Je Kamer Rapportage 2014

Samenvatting 2014/2015

Exodus 17,1-7 - Water uit de rots voor mensen met een kort lontje

Samenvatting 2013/2014

Research Note Prestatie-analyse met behulp van box plots

Neem nu even tijd om de Heilige Geest te vragen je te helpen bij deze studie en inzicht te geven in zowel het Woord als in je eigen leven.

Informatie over de deelnemers

De Robijn Nieuwsbrief Januari Het wonder komt ongemerkt je geest binnen wanneer die even pas op de plaats maakt en stil is.

Onderzoek Inwonerspanel: Maatschappelijke stage (MAS)

Wat is PDD-nos? VOORBEELDPAGINA S. Wat heb je dan? PDD-nos is net als Tourette een neurologische stoornis. Een stoornis in je hersenen.

Samenvatting. BS Het Veenpluis/ Zevenhuizen. Resultaten Oudertevredenheidspeiling (OTP) BS Het Veenpluis

Samenvatting. BS Klingelenburg. Resultaten Oudertevredenheidspeiling (OTP) BS Klingelenburg. Ouders vinden 'De leerkracht' op school het belangrijkst

Inhoud. Aan jou de keuze 7. Niet alleen maar een boek 187. Auteurs 191. Dankwoord 197

VOORBEELD / CASUS. Een socratisch gesprek volledig uitgeschreven

Samenvatting. BS Het Kleurenorkest. Resultaten Oudertevredenheidspeiling (OTP) BS Het Kleurenorkest

Samenvatting. BS De Toermalijn/ Rotterdam. Resultaten Leerlingtevredenheidspeiling (LTP) BS De Toermalijn

Samenvatting. BS Panningen-Noord/ Panningen. Resultaten Oudertevredenheidspeiling (OTP) BS Panningen-Noord

Zin in schrijven! Workshop vrij en creatief schrijven voor jonge anderstaligen door Fros van der Maden - auteur Op Schrift -

Module 5 Reaching A2 Unit 1 ID&T goes to Brazil

We hebben verleden week nog gewinkeld. Toen wisten we het nog niet. De kinderbijslag was binnen en ik mocht voor honderd euro kleren uitkiezen.

Om mee te beginnen: boekfragment en opdrachten

Een nieuw jaar nieuwe kansen en 9 tips die je helpen je doelen te bereiken. coaching en energetische therapie.

Evaluatie Back to Basics: De Nieuwe Koers

Transcriptie:

Karina van Dalen-Oskam Altijd naar het noorden Gebruik en functie van namen in Boven is het stil van Gerbrand Bakker Nederlandse versie van Immer nach Norden. Gebrauch und Funktion von Eigennamen im Roman Oben ist es still von Gerbrand Bakker. Ein Pilotprojekt zur vergleichenden literarischen Onomastik, in Beiträge zur Namenforschung Neue Folge Bd 47 (2012), Heft 1, p. 33-58 (Aus dem Niederländischen übertragen von Volker Kohlheim). karina.van.dalen@huygens.knaw.nl http://www.huygens.knaw.nl/vandalen/ 1. Inleiding Samenvatting: Het artikel presenteert de eerste resultaten van een pilot project op het gebied van computationeel onderzoek naar literaire stijl. De onderzochte stilistische elementen zijn eigennamen en het onderzoek betreft gebruik en functie van namen in literaire werken (vergelijkende literaire onomastiek). Als casus wordt de roman Boven is het stil van Gerbrand Bakker genomen, met zijn vertaling in het Engels onder de titel The Twin. Verschillende lezers hebben verschillende intuïties over het aandeel van namen in deze roman, vooral waar het geografische namen betreft. Een kwantitatieve benadering maakt een eerste vergelijking mogelijk van het gebruik van namen in deze roman met dat in negentien andere Nederlandse romans. De ontwikkelde methode maakt onderscheid tussen naamtokens, naamlemma's, mentions, en entiteiten die een naam krijgen. Ook wordt onderscheid gemaakt tussen namen die verwijzen naar werkelijk bestaande personen, plaatsen en zaken en namen die verwijzen naar fictieve, alleen in de romanwerkelijkheid bestaande personen, plaatsen en zaken. De resultaten van de kwantitatieve vergelijking laten zien dat de verschillende intuïties over namengebruik in Boven is het stil / The Twin alle deels correct zijn en deels niet. Ze maken zichtbaar dat de geografische namen enkele speciale functies hebben. Ook leiden de resultaten tot nieuwe onderzoeksvragen, zoals naar de cognitieve verwerking van literaire namen. Namen zijn zo gewoon dat ze vaak over het hoofd worden gezien. Dat geldt ook voor literaire namen, of beter gezegd: namen in literaire teksten. 1 Toch kunnen ze krachtige stilistische elementen zijn: één naam kan vele associaties in zich bergen, die door de lezer al dan niet worden opgepikt, afhankelijk van de achtergrond en encyclopedische kennis van die lezer. Voor de auteurs geldt trouwens hetzelfde: namen worden veelal niet heel bewust gekozen, zoals uit interviews is gebleken, maar achtergrond en kennis van de auteur spelen ook mee bij het kiezen van namen. Een naam moet 'passen', maar of deze past, wordt gewoonlijk gevoelsmatig bepaald. 2 Namen kunnen dus de ervaring van een literaire tekst sturen en de lezer manipuleren, en dat maakt ze zulke krachtige stijlelementen. 3 We creëren al lezend andere verhaalwerkelijkheden voor personages met de naam Henk, Tristan of Ismaiel, 4 1 Zie voor een overzicht van eerder onderzoek naar namen in Nederlandstalige literatuur Van Dalen-Oskam 2005a en 2005b. 2 Vgl. Debus 2002, Brendler & Iodice 2004. 3 Vgl. ook Van Dalen-Oskam 2002 en 2012. 4 Persoonsnamen uit resp. Gerbrand Bakker, Boven is het stil, Tommy Wieringa, Alles over Tristan, en Kader Abdolah, Spijkerschrift. 10 april 2012 1

en hebben andere associaties bij de locaties waar de verhalen zich afspelen alleen al door het lezen van geografische namen als Broek, Mercedal of Saffraandorp. 5 Omdat de associaties die namen oproepen zo afhankelijk zijn van de achtergrond en kennis van (de auteur en) de lezer is het voor onderzoekers moeilijk om de functies van namen als stilistisch element te inventariseren en over verschillende werken, auteurs, genres etc. met elkaar te vergelijken. Ook een letterkundig onderzoeker met een brede algemene kennis zal meer of minder voeling hebben met de verhaalwerelden in verschillende werken of van verschillende auteurs en daardoor meer of minder associaties en functies herkennen. Dit verschil is het best te illustreren met de ervaring die vele lezers en onderzoekers zullen hebben als zij literaire werken uit andere talen of culturen lezen - het zijn vaak juist namen die een nadere uitleg nodig hebben voor een goed begrip van een werk. Een zo objectief mogelijke vergelijking kan dus alleen worden gemaakt als er vele onderzoekers, elk met hun eigen achtergronden en kennis, samenwerken. Dat betekent tegelijkertijd dat het onderzoek sterk geformaliseerd moet worden. Dat geldt niet alleen voor stilistisch onderzoek naar namen, maar ook voor onderzoek naar andere stilistische elementen. Namen lijken relatief gemakkelijk herkenbare stilistische elementen en zouden daarom een goede testcase kunnen zijn voor het ontwikkelen van een comparatieve stilistische methode. In deze bijdrage wil ik rapporteren over de voortgang van dit proces. De bevindingen zullen worden geïllustreerd aan de hand van de roman Boven is het stil van Gerbrand Bakker. 2. Onderzoeksvragen In het verleden schreven onderzoekers gewoonlijk over 'opvallende' namen in een literair werk, zonder nader in te gaan op wat die namen opvallend maakte. Deze publicaties waren kwalitatief van aard (dus zonder een kwantitatieve onderbouwing), en waren voor lezers die de bestudeerde tekst(en) niet kenden nauwelijks interessant. Relatief recentelijk kwam als reactie daarop de wens naarvoren dat niet alleen opvallende namen worden bestudeerd, maar alle namen in een werk of oeuvre, ofwel: de namen in hun 'onymisch landschap' (namenlandschap). 6 Pas dan zou duidelijk kunnen worden wat opvallende namen zijn en waarom ze opvallend zijn. Om een fictief voorbeeld te geven: als een werk vol staat met 'exotische' namen, dan is een naam als Jan de opvallende naam. 7 De wens om het hele namenlandschap in de analyse mee te nemen leidt vanzelf tot een kwantitatieve aanpak van het onderzoek naar dit stilistische element, en maakt het tegelijkertijd noodzakelijk om computerhulp in te zetten om het verzamelen en het analyseren van grote hoeveelheden data te ondersteunen. Er is dan een onderscheid te maken tussen het inventariseren van het voorkomen van namen en het inventariseren van de functies van die namen. Pas als we weten wat 'gewoon' is, kunnen we zien wat opvallend is. Wat ik wil weten is hoeveel voorkomens van namen er gewoonlijk in een roman aangetroffen worden, en hoeveel van die voorkomens een persoonsnaam, een geografische naam, of 5 Geografische namen (plaatsnamen) uit resp. Gerbrand Bakker, Boven is het stil, Tommy Wieringa, Alles over Tristan, en Kader Abdolah, Spijkerschrift. 6 Vgl. Van Dalen-Oskam 2005c, 2006, 2009 voor meer informatie. 7 Vgl. ook Palacas 2005, Sobanski 1998. 10 april 2012 2

een naam van een zaak zijn. Ook wil ik weten hoevel verschillende namen het betreft en hoeveel verschillende personen, plaatsen of zaken met die namen worden aangeduid. Wat de mogelijke functies betreft is een zinvol onderscheid dat tussen plot interne en plot externe namen. 8 Plot interne namen verwijzen naar personages, plaatsen of zaken die uitsluitend 'bestaan' binnen de fictie van de roman. Plot externe namen verwijzen naar personen, plaatsen of zaken die in de werkelijke wereld bestaan. De meeste geografische namen lijken plot extern te zijn, verwijzend naar 'echte' landen, steden, straten, etc. Zij hebben een werkelijkheidsverhogende functie. 9 In fantasy romans daarentegen zijn de geografische namen gewoonlijk plot intern, en is hun functie het creëren en ondersteunen van de fictie, de onwerkelijkheid van (de locatie van) het verhaal. Als werkelijk bestaande of bestaand hebbende personen als handelend personage optreden in een literaire tekst, dan beschouw ik deze als deel uitmakend van de fictie die de auteur heeft gecreëerd en hun namen als plot intern. Door deze benadering kan onderscheid gemaakt worden tussen actieve, handelende personages en werkelijk bestaande personen zoals politici, schrijvers, componisten en zo verder, die alleen maar terloops worden vermeld. Dergelijke plot externe persoonsnamen lijken gewoonlijk de functie te hebben om de fictionele personages in het verhaal nader te karakteriseren in hun persoonlijkheid, hun sociale positie en hun politieke of culturele voorkeuren. De verwachting is nu dat verschillende auteurs, genres, tijdperioden en zelfs talen en culturen een van elkaar verschillend gebruik maken van deze naamtypen en naamfuncties en dat een analyse van gebruik en functies verschillende trends zichtbaar zal maken. 10 Die trends dienen uiteindelijk geplaatst te worden binnen een bredere (literaire, cultuurhistorische maar wellicht ook cognitieve) context om de achtergronden van de verschillen te helpen verklaren. Mijn doel is dus het ontwikkelen van een taaloverschrijdende en diachroon toepasbare methode die de grootschalige vergelijking van gebruik en functie van namen als stilistisch element in literaire werken mogelijk maakt. 3. Aanpak en hindernissen Deze ambitie veronderstelt samenwerking tussen vele onderzoekers. Het is dus noodzakelijk om ervoor te zorgen dat al die onderzoekers de teksten die zij analyseren op dezelfde manier verwerken. Zij moeten dezelfde woordvormen (tokens) als naam markeren om hun analyses vergelijkbaar te maken. Dat klinkt eenvoudig, maar dat is het niet. Zelfs naamtheoretici hebben verschillende opvattingen over wat een naam is en wat niet, zoals o.a. beschreven is in de belangrijke monografie Theory and Typology of Proper Names van Willy van Langendonck uit 2007. Voor het stilistische onderzoek naar namen moeten we dus richtlijnen opstellen. Op basis van praktische ervaringen met een kleine groep (internationale) onderzoekers is besloten om alleen 'prototypische' namen voor dit onderzoek als naam te beschouwen. Ofwel: de woorden waarover de meeste mensen het eens zijn dat het namen 8 Sobanski 2000: 64 e.v. maakt onderscheid tussen sujet-interne en sujet-externe namen; vgl. ook Van Dalen-Oskam 2009: 442-444. 9 Vgl. Debus 2002: 76. 10 Vgl. Van Dalen-Oskam 2005c, 2006. 10 april 2012 3

zijn. De tweede richtlijn is dat het de naam van een uniek persoon, een unieke plaats, of een unieke zaak moet zijn. Dat laatste houdt bijvoorbeeld in dat een DC-2 geen naam is, maar de Uiver als naam van die ene DC-2 wel. 11 Van de analyse uitgesloten zijn bijvoorbeeld namen van valuta, dagen van de week, en maanden - die door sommige maar niet alle naamkundigen als namen worden beschouwd. Ook bij deze strakke inperking blijven er twijfelgevallen over, onder meer of iets een geografische naam is of een naam van een zaak. Voor dit soort gevallen is een lijst met afspraken gemaakt. Al met al zijn er enkele pagina's met richtlijnen en afspraken opgesteld, waarop ik hier verder niet zal ingaan. Om de analyses die we in gedachten hebben te maken, kunnen we niet volstaan met het markeren en opsommen van de naamvormen uit een werk. We willen uiteraard ook verschillende vormen van dezelfde naam kunnen groeperen en samen kunnen nemen in de tellingen. Bijvoorbeeld de naamvormen Arne en Arne's: beide tokens 12 (woordvormen) dienen een lemma (hoofdwoord) te krijgen, ARNE in dit geval. Verschillende namen voor dezelfde persoon dienen eenzelfde identificatie te krijgen. De voornaam Alfred en de achternaam Issendorf zijn beide namen van het personage dat we identificeren als ALFRED ISSENDORF. En we vermelden bovendien dat deze namen plot intern zijn, terwijl namen als Roald + Amundsen de markering plot extern krijgen. 13 Terwijl de eerste analyses al in volle gang waren, bleken er nog twee niveaus van aggregatie nodig te zijn om de resultaten goed vergelijkbaar te maken: die van de mentions en van de naamtokens. Onder mentions verstaan we voorkomens van een naam, onafhankelijk van het aantal tokens waaruit de naam bestaat. 14 Dus de geografische naam Monnickendam, bestaand uit één token, is één mention. Maar ook de geografische naam Noord-Hollands Kanaal (twee tokens) beschouwen we als één mention. 15 Het aangeven van het aantal naamtokens is met name van belang als we ook werken in andere talen bij de analyse willen betrekken. De regels rondom het los of aanelkaar schrijven van naamonderdelen verschillen namelijk tussen talen. Dat blijkt het duidelijkst als we naar directe vertalingen kijken. De Nederlandse persoonsnaam Gerrit- Jan, bijvoorbeeld, met een verbindingstreepje en daardoor gerekend als één token, wordt in het Engels wel vertaald als Gerrit Jan, en dan hebben we twee tokens. 16 Het is dus zinvol om voor sommige vergelijkingen te kunnen abstraheren van het aantal naamtokens, en bijvoorbeeld te focussen op een vergelijking van het aantal mentions. Maar een klein deel van al deze aspecten kan door software worden ondersteund. Uiteraard zouden we graag een groot corpus van moderne literaire teksten digitaal beschikbaar willen hebben, om vervolgens gebruik te maken van naamherkennings- en classificatie-software, named entity recognition and classification (NERC) tools. Er zijn echter nauwelijks moderne romans digitaal beschikbaar. Bovendien zijn de NERCs nog lang niet goed genoeg voor de markeringen die we voor dit stilistische onderzoek nodig 11 Voorbeeld uit Marcel Möring, In Babylon. Amsterdam: Meulenhoff, 1997. 12 Voorbeeld uit Willem Frederik Hermans, Nooit meer slapen. 13 Voorbeelden uit Willem Frederik Hermans, Nooit meer slapen. 14 De term is door mij gemunt op basis van het gebruik van het woord in receptieonderzoek ter aanduiding van een vermelding van een auteursnaam als teken van receptie van het werk van die auteurs in enigerlei vorm. 15 Voorbeelden uit Gerbrand Bakker, Boven is het stil. 16 Voorbeeld uit Harry Mulisch, De aanslag, en de Engelse vertaling The assault. 10 april 2012 4

hebben. NERCs maken gewoonlijk onderscheid tussen persoonsnamen, namen van locaties en namen van organisaties. Soms is er een vierde categorie, 'overige' ('miscellaneous'). 17 De mate van correctheid is gewoonlijk tussen de 70 en 80 procent. 18 Voor toepassingen in de taalkunde of de taal- en spraaktechnologie voldoet dat vooralsnog. Voor het namenonderzoek, dat een gedegen pilot-onderzoek wil zijn dat als fundament voor verder onderzoek wil dienen, voldoet dit absoluut niet. Hiervoor willen we een zo hoog mogelijke correctheid hebben - en bovendien meer categorieën en meer lagen van markering. Voor het namenonderzoek betekent dit dus dat er nog heel veel handmatig correctiewerk en aanvullende markering moet paatsvinden - de mate van correctheid van handmatige naammarkering is wel ingeschat op 98 procent. 19 Het is momenteel zelfs onduidelijk of de inzet van NERCs het analyseproces sowieso wel helpt versnellen of verbeteren. Alle tijd die de onderzoeker besteed aan het leren omgaan met de tools en het zigzag door de tekst heen verbeteren van de voorgestelde markeringen gaat af van de tijd die de onderzoeker zou kunnen besteden aan een lineaire lezing-metmarkering van de teksten - een aanpak die als neveneffect heeft dat de onderzoeker de teksten nog weer beter leert kennen, iets wat essentieel is wanneer de analyses later geëvalueerd gaan worden. De computer speelt al wel een essentiële rol in het analyseren van de resultaten: eenmaal verzamelde data worden met behulp van scripts omgezet naar een dataformaat dat statistische verwerking en visualisering van de resultaten mogelijk maakt, bijvoorbeeld in Microsoft Excel. Enkele eerste resultaten, die een indruk kunnen geven van wat er van dit soort comparatief stilistisch onderzoek in de toekomst verwacht kan worden, zullen nu worden besproken aan de hand van Gerbrand Bakkers roman Boven is het stil. 4. Case study: Gerbrand Bakker, Boven is het stil (2006) In Boven is het stil lezen we hoe Helmer van Wonderen, een kleine boer in Waterland, zich op zijn vijfenvijftigste stap voor stap ontworstelt aan het leven zoals hem dat door de omstandigheden is opgelegd en waar hij zich niet eerder tegen heeft verzet. Toen hij net zeven maanden Nederlandse taal- en letterkunde studeerde aan de Universiteit van Amsterdam, kwam zijn tweelingbroer Henk om bij een auto-ongeluk. Henk was de boer van de twee en degene die de boerderij zou overnemen. Na de dood van Henk werd Helmer door hun vader in die rol geplaatst. Dertig jaar later, nu hun vader op sterven ligt, begint Helmer aan de verwerking van Henks dood en aan het vormgeven van zijn eigen leven. Het is een kleine wereld die we in deze roman leren kennen. Althans, dat is het gevoel van enkele Nederlandse lezers uit mijn omgeving. Op mijn vraag of de roman naar hun idee veel namen bevat, antwoordden zij negatief. Diezelfde vraag gesteld aan een Amerikaanse lezer van de Engelse vertaling uit 2009, The Twin, leverde echter een andere reactie op. Zijn antwoord was dat er opvallend veel namen, en dan met name 17 Zoals in de Stanford NER (versie januari 2009) die de beste resultaten gaf op een aantal Engelse romans, vgl. http://nlp.stanford.edu/ner/index.shtml (actief 4-3-2011). 18 Vgl. Sekine and Ranchod 2009. 19 Bogers 2004: 7. 10 april 2012 5

geografische namen in de roman voorkomen. Dit zijn twee tegengestelde intuïties. In het nu volgende zal ik nagaan wat de feitelijke situatie is en reflecteren op de redenen voor de zo verschillende reacties. Eerst presenteer ik een getalsmatig overzicht van de namen in deze ene Nederlandse roman (vet) met direct daarachter (cursief) de aantallen zoals die in de Engelse vertaling van de hand van David Colmer zijn geconstateerd. Als we alle namen in de Nederlandse roman en de Engelse vertaling bekijken (Tabel 1), zien we dat er in de Nederlandse tekst in totaal 179 entiteiten een naam hebben gekregen, dus 179 verschillende personen, plaatsen, of zaken. In de Engelse vertaling zijn dat er iets minder: 168. Het aantal verschillende lemma's dat voor deze entiteiten is gebruikt, is 187 in het Nederlands, tegenover 176 in het Engels. Deze lemma's komen voor in 1388 naamsvermeldingen (mentions) in de Nederlandse roman, terwijl de Engelse vertaling er iets minder heeft, 1383. Het aantal tokens dat in het Nederlands en het Engels is gebruikt in al deze mentions verschilt echter omgekeerd. Hier wordt het aantal Nederlandse tokens, 1476, namelijk ruimschoots overtroffen door het aantal Engelse, 1540. Dit laatste verschil komt, zoals hierboven al is aangeduid, vrijwel zeker voort uit tokenization-verschillen in de twee talen. Type category Ids lemmas mentions Tokens (named entities) Alle namen All 179 168 187 176 1388 1383 1476 1540 EXT 154 144 161 154 350 348 413 467 INT 25 24 26 25 1038 1038 1063 1076 Tabel 1. Alle namen in Boven is het stil (vet) en The Twin (cursief) Type category Ids lemmas mentions tokens (named entities) Persoonsnamen All 42 37 49 45 1068 1068 1096 1113 EXT 20 15 26 22 36 35 39 46 INT 22 22 23 23 1032 1033 1057 1067 Geogr. namen All 115 112 115 115 285 287 314 357 EXT 112 110 112 113 279 282 308 348 INT 3 2 3 2 6 5 6 9 Overige namen All 22 19 23 20 35 31 66 73 EXT 22 19 23 20 35 31 66 73 INT - - - - Tabel 2. De drie hoofdcategorieën persoonsnamen, geografische namen en overige namen in Boven is het stil (vet) en The Twin (cursief) Uit Tabel 1 wordt vervolgens duidelijk dat de roman meer verschillende plot externe namen bevat (154 en 144 IDs) dan plot interne, maar dat de kleine groep plot interne namen verreweg de meeste vermeldingen (1038 en 1038 mentions, 1063 en 1076 tokens) kent. Het lijkt op basis van deze getallen dat de verschillen tussen de Nederlandse tekst en de Engelse vertaling niet voldoende kunnen verklaren waarom een Amerikaanse lezer 10 april 2012 6

het gevoel heeft dat er veel namen in voorkomen en een Nederlandse lezer weinig. Het zit hem dus niet in de vertaling zelf. De Amerikaanse lezer maakte melding van een hoog aandeel van geografische namen. Daarom kijken we nu eerst naar de getallen voor de drie hoofdcategorieën die we in de metingen hebben onderscheiden (Tabel 2). De categorie met de minste namen is die van de Overige namen, in alle kolommen. Het aantal verschillende persoonsnamen is veel kleiner dan het aantal verschillende geografische namen, maar het aantal mentions en tokens in persoonsnamen ligt veel en veel hoger dan voor de geografische namen. Een ander belangrijk verschil dat we zien is het ontbreken of zeer geringe aandeel van plot interne geografische en overige namen, terwijl bij de persoonsnamen bij de mentions en tokens de plot interne namen overheersen. Om het beeld nu compleet te maken, kijken we ook nog naar de volgende onderverdeling die in de metingen is gemaakt, die in de persoonsnamen een onderscheid maakt tussen bijnamen, familienamen en voornamen (die laatste zijn ook nog onderverdeeld naar geslacht, maar dat blijft nu verder buiten beschouwing). Tabel 3 levert als nieuwe informatie op dat het de voornamen zijn, en dan met name de plot interne, die met de meeste mentions en tokens vertegenwoordigd zijn. Het aantal mentions en tokens van familienamen valt in het niet bij die van de voornamen. Bijnamen spelen nauwelijks een rol. Type category Ids lemmas mentions tokens (named entities) Bijnamen All 1 1 1 1 7 7 7 14 EXT - - - - INT 1 1 1 1 7 7 7 14 Familienamen All 26 20 21 15 54 51 78 76 EXT 16 11 16 11 18 14 19 14 INT 10 9 5 4 36 37 59 62 Voornamen All 23 24 27 29 1007 1010 1011 1023 EXT 6 7 10 11 18 21 20 32 INT 17 17 17 18 989 989 991 991 Tabel 3. De drie subcategorieën van de persoonsnamen: bijnamen, familienamen en voornamen in Boven is het stil (vet) en The Twin (cursief) Nu we de belangrijkste getallen voor de namen in zowel de Nederlandse brontekst als de Engelse vertaling hebben bekeken, kunnen we al wel opmerken dat de lezersreacties niet verklaard kunnen worden door een significant verschil tussen het namengebruik in het origineel en de vertaling. Er moet dus iets anders aan de hand zijn. Wat we nu moeten nagaan is hoe gewoon het namenlandschap zoals we dat voor deze roman hebben leren kennen is in vergelijking met andere romans. Wellicht geeft dat inzicht in de verschillende reacties. Voor nu concentreer ik mij op alleen Nederlandse romans. Een uitvoeriger vergelijking met vertalingen in het Engels en Engelstalige romans en hun Nederlandse vertalingen komt bij een andere gelegenheid aan de orde. 10 april 2012 7

5. Het namenlandschap in twintig Nederlandse romans Om een eerste indruk te krijgen van de kwantitatieve distributie van namen in Nederlandse romans heb ik twintig romans in detail geanalyseerd. De selectie van de romans is bepaald door de volgende criteria: Gepubliceerd na 1945 Uit elk decennium een of enkele romans Meeste uit het laatste decennium dus focus op contemporaine romans Inclusief een beperkt aantal jeugdboeken Een aantal is gekozen op basis van mijn eigen voorkeuren Dat laatsre criterium komt wellicht wat vreemd over. De reden is dat de analyses, zoals eerder geschetst, momenteel nog een grote hoeveelheid handmatig werk vergen. De analyse van een roman die door de onderzoeker niet of nauwelijks wordt gewaardeerd gaat een stuk trager en moeizamer dan die van een wel gewaardeerde roman. Dit criterium speelt een praktische rol zolang we nog geen groot digitaal corpus van literaire teksten tot onze beschikking hebben, met de juiste tools om het verzamelen van de data aanzienlijk gemakkelijker te maken. Ongeveer de helft van de twintig gekozen romans representeert mijn eigen voorkeur. In Tabel 4 staan ze alle twintig vermeld, met in de laatste kolom het totaal aantal tokens dat de romans bevatten. Het geanalyseerde corpus van twintig romans bevat samen 1.111.683 tokens, meer dan een miljoen woordvormen dus. 20 De kinder- en jeugdboeken zijn gemarkeerd met een asterisk. Auteur Titel Jaar Totaal aantal tokens Abdolah, Kader Spijkerschrift 2000 83083 Bakker, Gerbrand Boven is het stil 2006 74849 Bernlef, J. Hersenschimmen 1984 46549 Boon, Louis Paul Menuet 1948 37251 Daems, Geertrui Koud 2001 47115 Dorrestein, Renate Verborgen gebreken 1996 64317 Dragt, Tonke *De brief voor de koning 1962 135609 Ferron, Louis Het stierenoffer 1975 60606 Glastra van Loon, Karel Lisa's adem 2001 60405 Haasse, Hella S. Fenrir 2000 35248 Hermans, Willem Frederik Nooit meer slapen 1966 83308 Loon, Paul van *Dolfje weerwolfje 1996 18076 Mulisch, Harry De aanslag 1983 56523 Nooteboom, Cees Het volgende verhaal 1991 28082 Peper, Rascha Vingers van marsepein 2008 91709 Terlouw, Jan *Oorlogswinter 1972 49622 20 De tokentellingen van verschillende computerprogramma's leveren verschillende hoeveelheden tokens op. Voor dit corpus heb ik gebruik gemaakt van de 'Word frequencies' optie van The Intelligent Archive, ontwikkeld aan het Centre for Literary and Linguistic Computing aan de Universiteit van Newcastle, Australië, door Hugh Craig en zijn team (zie http://www.newcastle.edu.au/school/hss/research/groups/cllc/intelligent-archive.html, actief 15-6-2011) 10 april 2012 8

Thomése, P.F. Schaduwkind 2003 15899 Vlugt, Simone van der *Schuld 2007 35274 Wieringa, Tommy Alles over Tristan 2002 37109 Wolkers, Jan Een roos van vlees 1963 51049 TOTAAL 1.111.683 Tabel 4. De twintig geanalyseerde Nederlandse romans In het vervolg van deze bijdrage zal ik een aantal aspecten van het naamgebruik in grafieken visualiseren, steeds aangevend waar Boven is het stil zich in het plaatje bevindt. We starten met een helicopterview: we bekijken het totaal aantal naamtokens en zetten dat uit tegen het totaal aantal tokens van de twintig romans. Dat levert het beeld op in Grafiek 1. Boven is het stil bevindt zich op het snijpunt van 74849 tokens totaal tegen 1476 naamtokens. Aan de grafiek is een lineaire trendlijn toegevoegd, zodat we kunnen zien dat een langere tekst globaal genomen ook meer naamtokens bevat dan een kortere tekst. Grafiek 1 8000 7000 6000 Aantal naamtokens 5000 4000 3000 2000 1000 0 0 20000 40000 60000 80000 100000 120000 140000 160000 Totaal aantal tokens in de tekst Grafiek 1. Het aantal naamtokens afgezet tegen het totaal aantal tokens in de twintig geanalyseerde Nederlandse romans Om een indruk te krijgen van het aandeel dat naamtokens uitmaken van het totaal aantal tokens, presenteren we voor alle twintig romans het percentage van de tokens dat een naam is (Grafiek 2). 10 april 2012 9

Grafiek 2 Loon Vlugt Dragt Terlouw Dorrestein Haasse Wieringa Peper Mulisch Ferron Abdolah Glastra Daems Nooteboom Bernlef Hermans Bakker Wolkers Thomese Boon 0.00% 1.00% 2.00% 3.00% 4.00% 5.00% 6.00% Percentage naamtokens van totaal aantal tokens in de tekst Grafiek 2. Het percentage naamtokens van hoogst naar laagst Het aardige van deze grafiek is dat de vier jeugdboeken uit het corpus de hoogste percentages naamtokens bevatten. Boven is het stil bevindt zich aan de andere kant van het spectrum, met een percentage net onder de 2 procent. Dat lijkt aan de onderste rand te zitten van wat in dit corpus als normaal beschouwd kan worden: een percentage van iets minder dan 2 tot iets meer dan 3 procent. 21 In de getalsmatige overzichten over Boven is het stil en The Twin is al duidelijk geworden dat de twee kwantitatief belangrijkste categorieën de persoonsnamen en daarna 21 In hun onderzoek naar de namen in de roman Wäldchestag van Andreas Maier (2000) vinden Rosa Kohlheim en Volker Kohlheim (te versch.) in deze roman 4,2% naamtokens. Zij vergelijken dit percentage met de ca. 3 % die in ander onderzoek als het gemiddelde percentage namentokens in gesproken taal wordt gegeven. 10 april 2012 10

de geografische namen zijn. Op die twee categorieën zoomen we nu in. Ook in de negentien andere romans is het aandeel persoonsnamen op token- en mentionniveau meestal aanzienlijk hoger dan het aandeel geografische namen. Maar als we naar het aantal verschillende IDs (met een naam aangeduide entiteiten) en lemma's kijken, is het beeld anders. In Grafiek 3 vergelijken we per roman het aandeel persoonsnamen en geografische namen met elkaar op lemmaniveau. We zien hierin het aantal verschillende geografische namenlemma's (zwart) en het aantal verschillende lemma's van persoonsnamen (wit). Wat nu opvalt, is dat Boven is het stil een van de weinige romans is waarin het aantal verschillende namenlemma's (en ook het aantal IDs) hoger is voor geografische namen dan voor persoonsnamen. De twee andere romans waarvoor dit geldt zijn Fenrir van Hella S. Haasse en Het volgende verhaal van Cees Nooteboom. Dit zou er op kunnen wijzen dat geografische namen in deze romans een extra dan wel een wat andere functie hebben dan in de romans waarin de balans omgekeerd is. Om na te gaan of dat voor Boven is het stil het geval is gaan we nu terug naar de roman zelf. Grafiek 3 180 160 140 120 100 80 60 40 20 0 Abdolah Bakker Bernlef Boon Daems Dorrestein Dragt Ferron Glastra Haasse Hermans Loon Mulisch Nooteboom Peper Terlouw Thomese Vlugt Wieringa Wolkers Grafiek 3. Het aantal verschillende lemma's van geografische namen (blauw) en persoonsnamen (rood) 6. Geografische namen in Boven is het stil Helmer van Wonderen woont op een boerderij enkele kilometers ten zuiden van Monnickendam. Ooit studeerde hij Nederlands in Amsterdam, maar na de dood van zijn tweelingbroer moest hij zijn studie opgeven en diens werk op de boerderij overnemen. Die gebeurtenis heeft zijn invloed gehad op Helmers 'territorium', het gebied dat hij sindsdien regelmatig doorkruist: 10 april 2012 11

Ik weet nog heel precies dat ik op de 19de een college historische taalkunde had omdat moeder toen ik thuiskwam zei dat Henk dood was. Wat voor colleges ik vóór of na die datum had, ben ik straal vergeten. Op de terugweg heb ik weer heel lang op het hoogste punt van de Schellingwouderbrug gestaan, nu starend over het Buiten-IJ, het moment van weer de trappers rondkrijgen uitstellend. De brug vierde in dat jaar zijn tweede lustrum. Ik voelde dat ik vergeten zou worden, vader en moeder waren de ouders, Riet de bijnavrouw, en ik was slechts de broer. Sinds die dag gaan vrijwel al mijn tochten naar het noorden, zuidelijker dan het dorp kom ik niet langer. (58-59) Alleen als Henks 'bijnavrouw' Riet na dertig jaar op bezoek komt, en later ook haar zoon, maakt Helmer een uitzondering op zijn regel om altijd naar het noorden te gaan (p. 81). Helmer gaat niet heel vaak op pad, maar als hij dat doet, lezen we ook heel precies waar hij heen gaat en welke route hij rijdt: In Monnickendam neem ik de N247 en blijf die volgen tot Edam. Daar rijd ik door het dorp naar de dijk, want als ik dat hier niet doe, kan ik pas bij Oosthuizen van de grote weg af. In de buurt van Warder zet ik de auto even stil om een zwerm vogels die daar vliegt goed te bekijken. (43) Ada wil via een andere weg terugrijden. We rijden door Hem en Blokdijk naar Hoorn. 'Laten we door de Beemster gaan,' zegt ze. 'De Beemster is mooi.' Ik steek via Berkhout door naar Avenhorn en Schermerhorn. Ik volg de borden richting Noordbeemster. 'De dorpen? ' vraag ik. 'De dorpen,' zegt Ada. (44) Die precieze routebeschrijvingen maken het geografische 'taboe' opvallender, pregnanter. Van zijn buurvrouw Ada hoort Helmer dat een jonge boer uit de omgeving, Jarno Koper, naar Denemarken vertrekt om daar te gaan boeren. Daar heeft hij nog de ruimte (33). Denemarken. Jutland, Sjaelland, Funen, Bornholm, Grote Belt, Kleine Belt, Odense. Ada heeft iets bij me losgemaakt. Glooiend land, ruim land, heidevelden. Jarno Koper is een boerenzoon die het hier wel heeft gezien. Een donkere jongen, hij zal een jaar of vijfentwintig zijn. Als ik hem spreek - wat heel zelden gebeurt - zegt hij altijd dingen als 'natte troep hier'. Hij gaat weg, hij durft naar Denemarken te gaan. (34) Het is die durf die Helmer aanspreekt. Denemarken wordt voor hem dan ook het symbool van durf en bevrijding. De eerste stap die Helmer in zijn eigen 'bevrijding' zet is het 'naar boven doen' van zijn zieke vader. Uit de grote slaapkamer op de begane grond verhuist Helmer zijn vader naar zijn eigen slaapkamer op de verdieping. En beneden knapt hij het helemaal op. Hij koopt een nieuw bed, tweepersoons ook al is hij alleen, een dekbed, twee kussens en fris blauw beddengoed. En dan moet er, volgens zijn buurvrouw Ada, 10 april 2012 12

'iets van kunst' komen (p. 30). Helmer vindt niets in de galeries in Monnickendam, maar bij een antiquair loopt hij tegen een verzameling kaarten aan. Wat ik met een oude kaart moet, weet ik niet, toch neem ik de stapel door. Noord- Holland, de droogmakerijen, iets wat ik niet direct herken, Marken, de Beemster. Ik laat de kaarten één voor één vallen tot ik weer terug ben bij wat ik niet herkende. Ik trek de kaart uit de stapel. Het is Denemarken, een oud Denemarken in overwegend groen, met drie bijkaarten, IJsland, Bornholm en de Faeröer. IJsland en de Faeröer zijn in bruine tinten. De kaart is gaaf, alleen de rand is wat vergeeld. (64) De kaart komt aan de muur te hangen in zijn slaapkamer. Ik heb gemerkt dat mijn bed steeds meer een plek is geworden waar ik rust vind. Geen slaap, maar rust. Soms doe ik mijn best om niet in slaap te vallen. Omdat er te veel gebeurt overdag. Het bed is een veilige plaats geworden, zoals vaders slaapkamer tot voor kort een veilige plaats was, of een stal vol koeien in de winter. Voor ik in bed stap, kijk ik naar de kaart van Denemarken en noem de namen van een aantal steden of dorpen. Ik heb niet langer de meeste belangstelling voor Jutland, ik vraag me niet meer af waar Jarno Koper neergestreken is. Steeds vaker doe ik 's middags een tukje. (166) Het opnoemen van plaatsnamen op de kaart van Denemarken (o.a. op p. 175, 188, 208) wordt een soort mantra. Helmer doet dat met name wanneer de sociale complicaties op de boerderij, waar de zoon van Riet als knecht is komen werken, hem te machtig worden. Ik doe de deur van mijn slaapkamer dicht en ga voor de kaart van Denemarken staan. 'Helsingør, ' zeg ik. 'Stenstrup, Esrum, Blistrup, Tisvildeleje. ' Vijf langzaam uitgesproken namen zijn niet genoeg vanavond. Ik doe er nog een paar eilanden bij. 'Samsø, Aerø, Anholt, Møn. ' Het grote bed staat voor me klaar. (224) Hier wordt het duidelijkst zichtbaar welke rol de Deense geografische namen voor Helmer spelen, hoe hij ze gebruikt - en dus ook welke stilistische effecten er in een tekst met namen bereikt kunnen worden. Als Helmers vader is overleden, komt de vroegere knecht Jaap bij toeval langs de boerderij. Helmer had een speciale band met hem; Jaap was de enige die behalve hun moeder de tweelingbroers altijd uit elkaar kon houden. Samen gaan Helmer en Jaap op reis. Naar Denemarken. 7. Evaluatie Wat kunnen we nu concluderen over de tegenstrijdige lezersintuïties over het voorkomen van namen in Boven is het stil? Het verrassende is dat ze allemaal in zekere zin kloppen én niet kloppen. In Grafiek 2 in paragraaf 5 bleek dat het percentage tokens in Boven is het stil dat een naam is of deel uitmaakt van een naam iets onder de 2 procent ligt, en dat 10 april 2012 13

dat aan de lage kant is vergeleken met de andere 19 geanalyseerde romans. Toen we naar de verhouding tussen persoonsnamen en geografische namen keken, zagen we dat er op het lemmaniveau meer geografische namen dan persoonsnamen voorkwamen en dat dat opvallend is in verglijking met de andere romans uit het corpus. Grafiek 4 Nooteboom Terlouw Haasse Hermans Abdolah Dragt Mulisch Bakker Wieringa Daems Peper Bernlef Dorrestein Thomese Glastra Ferron Wolkers Vlugt Boon Loon 0.00% 0.10% 0.20% 0.30% 0.40% 0.50% 0.60% 0.70% 0.80% Percentage geografische naamtokens van totaal aantal tokens in de tekst Grafiek 4. Het percentage geografische naamtokens van hoogst naar laagst Als we alleen de Deense plaatsnamen op de kaart aan Helmers slaapkamermuur weglaten uit de berekeningen, wordt het aantal verschillende lemma's voor geografische namen van 115 gereduceerd tot 86, nog steeds aanzienlijk meer dan de 49 lemma's van persoonsnamen. Het zal dus de combinatie van de expliciete rijroutes van Helmer in Noord-Holland én zijn oplezen van Deense plaatsnamen van de kaart aan de muur van zijn slaapkamer zijn die geografische namen in Boven is het stil in vergelijking met de 10 april 2012 14

persoonsnamen een zwaarder gewicht geven. Maar als we kijken naar het aandeel tokens in de geografische namen in vergelijking met de andere romans (dus onafhankelijk van de verscheidenheid aan lemma's), dan zien we dat Boven is het stil niet uitzonderlijk scoort, maar ergens in de middenmoot zit (Grafiek 4). De persoonsnamen blijven echter in vergelijking met de andere romans percentueel in de lagere regionen scoren (Grafiek 5). Grafiek 5 Loon Vlugt Dragt Terlouw Dorrestein Wieringa Peper Mulisch Haasse Ferron Glastra Abdolah Daems Hermans Bakker Bernlef Nooteboom Wolkers Thomese Boon 0.00% 1.00% 2.00% 3.00% 4.00% 5.00% 6.00% Percentage tokens persoonsnamen van totaal aantal tokens in de tekst Grafiek 5. Het percentage naamtokens van persoonsnamen van hoogst naar laagst Uit het feit dat Grafiek 5 enkel op details afwijkt van Grafiek 2, met het totale naamtoken percentage, blijkt trouwens hoe belangrijk het aandeel van de persoonsnamen is. Het is daarom ook nog zoeken naar een inzichtelijke manier om het namengebruik op de verschillende niveaus van IDs, lemma's, mentions en tokens goed met elkaar 10 april 2012 15

vergelijkbaar te maken. De geschetste verhouding tussen lemma's van geografische namen en persoonsnamen kan een stap in de goede richting zijn. 22 De verschillende intuïties van de Nederlandse lezers tegenover de Amerikaanse lezer kunnen wel degelijk daarnaast ook met twee andere zaken te maken hebben, gerelateerd aan de functie van namen en naamtypen. Ten eerste: zoals ik in paragraaf 2 heb betoogd en ik in het kwantitatieve onderzoek van twintig romans ook kon bevestigen (maar hierboven niet aan de orde heb kunnen stellen), is het overgrote deel van de geografische namen plot extern. Het zijn namen die verwijzen naar 'echte' landen, steden, straten, etc. Hun basisfunctie kan worden omschreven als werkelijkheidsverhogend. De analyse van Boven is het stil heeft laten zien dat zij soms ook nog andere functies kunnen hebben, zoals het zichtbaarder maken van een 'geografisch taboe' (de Noord-Hollandse plaatsnamen). Ook kunnen namenlijstjes of het opsommen van namen voor personages een kalmerende functie hebben (de Deense plaatsnamen). Het is hier vermoedelijk juist het plot externe van de namen dat geruststelt: zakelijke feiten, in hun opsomming ontbloot van lastige en verwarrende emoties. Ten tweede: de impliciete kennis van (de gemiddelde) Nederlandse en (in dit geval) Amerikaanse lezer. Alhoewel de geografische naamsverscheidenheid groter is dan de verscheidenheid aan persoonsnamen, is het tokenaandeel van geografische namen niet opvallend hoog in de roman. Voor Nederlandse lezers, die gewoonlijk de meeste van de gebruikte namen in in ieder geval Noord-Holland kennen, functioneren de namen concreet ook als werkelijkheidsverhogend. Voor lezers uit andere culturen, die misschien alleen Amsterdam (met enig geluk) zouden weten te lokaliseren, zeggen al die Noordhollandse namen niets. Die namen zullen de lezers meestal onbekend zijn, en daardoor helemaal niet werkelijkheidsverhogend functioneren. Integendeel, ze roepen bij de lezer in feite zijn of haar gebrek aan kennis op en de wens tot een toelichting. Misschien kunnen we wel stellen dat voor dergelijke lezers deze geografische namen dezelfde functie hebben als de plot interne geografische namen in bijvoorbeeld fantasy romans. 23 Het is dan ineens ook begrijpelijk waarom sommige jeugdboeken erg weinig geografische namen bevatten (Grafiek 4), en ook waarom sommige vertalers zo nu en dan geografische namen weglaten. Dat roept sowieso vragen op rond de vertaalproblematiek van namen - vertalers zullen soms danig met de namen in hun brontekst in hun maag zitten. En hiermee zijn verschillende mogelijke vervolgonderzoeken in de kern geschetst. 8. Conclusie Namen zijn een fascinerend stilistisch element dat naar het zich laat aanzien goed kwantitatief te analyseren is. Dat betekent dat intuïties van lezers/onderzoekers concreet kunnen worden onderbouwd of ontkracht. De kwantitatieve resultaten leiden bovendien tot nieuwe onderzoeksvragen. In het geval van de geografische namen in de casus in deze bijdrage, Boven is het stil van Gerbrand Bakker en de Engelse vertaling ervan, ligt de belangrijkste nieuwe vraag op het terrein van de verwerking van namen door lezers met 22 Rosa Kohlheim en Volker Kohlheim (te versch.) signaleren kwantitatieve verschillen in naamtypen in de roman Wäldchestag van Andreas Maier (2000) en Nooit meer slapen van Willem Frederik Hermans (1966) en relateren dat aan de verschillende plots en settings van de twee romans. 23 Zie voor meer informatie over fictionele geografische namen Van Dalen-Oskam 2010. 10 april 2012 16

verschillende kennis, bijvoorbeeld gerelateerd aan leeftijd of culturele achtergronden. Hiervoor zal naar verwachting nader onderzoek moeten worden gedaan in samenwerking met psychologen, bijvoorbeeld naar wat wel depth of processing wordt genoemd, verschillen in 'levels of attention to different parts of a text', zoals Catherine Emmott en Marc Alexander (2010) dat formuleren in een mooi artikel over lezersmanipulatie in detectiveromans. Emmott en Alexander laten prachtig zien hoe Agatha Christie gebruik maakt van te verwachten shallow processing bij haar lezers in het construeren van de plot van een van haar detectives. Zij hebben het niet specifiek over namen, maar die zouden wel degelijk in vergelijkbaar onderzoek nader onderzocht kunnen worden. Daarin zou kunnen worden gekeken of verschillende naamtypen uitnodigen tot shallow of deep processing en in hoeverre dat samenhangt met leeftijd of achtergrond van de lezer. Dat is slechts een van de mogelijke vervolgstappen. Hoe dan ook is het noodzakelijk dat er veel meer digitaal materiaal beschikbaar komt een groot onderzoekscorpus met literaire teksten uit alle eeuwen, inclusief contemporaine romans en dat er tools worden ontwikkeld waarmee de analyse aanzienlijk vergemakkelijkt kan worden en het aandeel handmatig werk sterk gereduceerd kan worden. Geanalyseerde romans Kader Abdolah, Spijkerschrift. Notities van Aga Akbar. De Geus, 2000 (16 e dr., 1009) Gerbrand Bakker, Boven is het stil. Amsterdam: Cossee, 2006 Gerbrand Bakker, The Twin. Translated from the Dutch by David Colmer.London: Vintage Books, 2009 J. Bernlef, Hersenschimmen. Amsterdam: Em. Querido's Uitgeverij B.V., 1984 Louis Paul Boon, Menuet. Amsterdam / Antwerpen: De Arbeiderspers, 1948 (17 e dr., 2004) Geertrui Daem, Koud. The House of Books, 2001 Renate Dorrestein, Verborgen gebreken. Amsterdam/Antwerpen: Uitgeverij Contact, 2004 Tonke Dragt, De brief voor de koning. Amsterdam: Leopold, c. 1962 (11 e dr. 1988) Louis Ferron, Het stierenoffer. Amsterdam: De Bezige Bij, 1975 Karel Glastra van Loon, Lisa's adem. Amsterdam / Antwerpen: L.J. Veen, 2001 (5 e dr., 2002) Hella S. Haasse, Fenrir. Een lang weekend in de Ardennen. Amsterdam: E. Querido's Uitgeverij, 2000 Willem Frederik Hermans, Nooit meer slapen. Amsterdam, 1966 (23 e dr., 1993) Paul van Loon, Dolfje Weerwolfje. Amsterdam: Leopold, c. 1996 (23 e dr., 2006) Harry Mulisch, De aanslag. Amsterdam: Uitgeverij de Bezige Bij, 1982 (6 e dr., 1982) Cees Nooteboom, Het volgende verhaal. (Boekenweekgeschenk). Amsterdam /Antwerpen: De Arbeiderspers, 1991 Rascha Peper, Vingers van marsepein. Z.pl.: Nieuw Amsterdam, 2008. Jan Terlouw, Oorlogswinter. Rotterdam: Lemniscaat, 1972 (57 e dr. 2003) P.F. Thomése, Schaduwkind. Amsterdam /Antwerpen: Uitgeverij Contact, 2003 (11 e dr. 2005) Simone van der Vlugt, Schuld. Rotterdam: Lemniscaat, 2007 (2 e impr, 2008) Tommy Wieringa, Alles over Tristan. Amsterdam: de Bezige Bij, 2002 Jan Wolkers, Een roos van vlees. Amsterdam: Meulenhoff, 1963 (36 e dr., 2005) 10 april 2012 17

Bibliografie Bogers, T. (2004). Dutch Named entity Recognition: Optimizing Features, Algorithms, and Output. http://ilk.uvt.nl/~toine/publications/bogers.2004.thesis.pdf Brendler, A. & Iodice, F. (2004). 'Interview mit Maurizio Maggiani über Namen' In: Namenkundliche Informationen 85/86, p. 165-173 Van Dalen-Oskam, K. & van Zundert, J. (2004). 'Modeling Features of Characters. Some Digital Ways to Look at Names in Literary Texts. ' In: Literary and Linguistic Computing 19-3 (2004), p. 289-301 Van Dalen-Oskam, K. (2002). 'Lolita's les. Persoonsnamen in Lisa's adem van Karel Glastra van Loon'. In: Naamkunde 34 (2002), p. 171-203 Van Dalen-Oskam, K. (2005a). 'Dutch literary onomastics. Past, present and future'. In: Eva Brylla, Mats Wahlberg, in collaboration with Vibeke Dahlberg, W.F.H. Nicolaisen (Eds.). Proceedings of the 21st International Congress of Onomastic Sciences, Uppsala, 19-24 August 2002. Vol. 1, Uppsala, 2005, p. 398-406 Van Dalen-Oskam, K. (2005b). The study of names in Dutch literary works: a bibliographical introduction. In: ONOMA 40 (2005), p. 283-292 Van Dalen-Oskam, K. (2005c). 'Vergleichende literarische Onomastik'. In: Brendler, A. und S. Brendler (Hrsg.). Namenforschung morgen: Ideen, Perspektiven, Visionen. Hamburg: Baar, 2005, p. 183-191. English translation, 'Comparative Literary Onomastics', at http://www.huygens.knaw.nl/wpcontent/bestanden/pdf_vandalenoskam_2005_comparative_literary_onomastics.pdf; Nederlandse vertaling: Vergelijkende literaire onomastiek. Op http://www.huygens.knaw.nl/wpcontent/bestanden/pdf_vandalenoskam_2005_vergelijkende_literaire_onomastiek.pdf Van Dalen-Oskam, K. (2006). 'Mapping the Onymic Landscape'. In: Maria Giovanna Arcamone, Donatella Bremer, Davide de Camilli e Bruno Porcelli (eds.): Il nome nel testo. Rivista internazionale di onomastica letteraria VIII (2006), p. 93-103. Atti del XXII Congresso Internatzionale di Scienze Onomastiche, Pisa, 28 agosto 4 settembre 2005 (Proceedings of the 22nd International Congress of Onomastic Sciences, Pisa 28. Aug. 3. Sept. 2005), vol. III Van Dalen-Oskam, K. (2009). 'Professor Nummedal is niet alleen. Een analyse van de namen in Willem Frederik Hermans' Nooit meer slapen'. In: Tijdschrift voor Nederlandse Taal- en Letterkunde 125 (2009), p. 419-449. (Pdf van 39 pagina's met ' Brongegevens bij 'Professor Nummedal is niet alleen' op http://www.huygensinstituut.knaw.nl/wpcontent/bestanden/pdf_vandalen_2009_brongegevens_professor_nummedal.pdf Van Dalen-Oskam, K. (2010). 'Mercedal, Lago, Tomés. Namen en geografische ruimte in Alles over Tristan van Tommy Wieringa.' In: Naamkunde 37 (2007-2010), p. 91-126 Van Dalen-Oskam, K. (2012). 'Who is Hvalbiff? Name and identity in W. F. Hermans' Beyond sleep'. To be published in: Oslo Studies in Language (https://www.journals.uio.no/index.php/osla/index) Debus, F. (2002). Namen in literarischen Werken: (Er-)Findung - Form - Funktion. Mainz: Akademie der Wissenschaften und der Literatur; Stuttgart: Franz Steiner Verlag Emmott, C. & Alexander, M. (2010). 'Detective fiction, plot construction, and reader manipulation: rhetorical control and cognitive misdirection in Agatha Christie's Sparkling Cyanide'. In: Dan McIntyre & Beatrix Busse (Eds.). Language and style. In honour of Mick Short. New York etc.: Palgrave Macmillan, 2010, p. 328-346 Kohlheim, R. & Kohlheim, V. (te versch.). 'Der literarische Name zur Jahrtausendwende: Andreas Maiers Roman Wäldchestag als Beispiel'. Te versch. in: Beiträge zur Namenforschung Neue Folge 46 10 april 2012 18

Van Langendonck, W. (2007). Theory and typology of proper names. Berlin / New York: Mouton de Gruyter Palacas, M. (2005). 'The Importance of Being ''Ernest'' in Mary Shelley's Frankenstein: A Study in Literary Onomastics'. In: Names 53-3 (September), p. 203-234 Sekine, S. & Ranchod, E. (2009). Named Entities. Recognition, classification and use. Amsterdam/Philadelphia: John Benjamins Sobanski, I. (1998). 'The Onymic Landscape of G.K. Chesterton's Detective Stories.' In: Proceedings of the XIXth International Congress of Onomastic Sciences, Aberdeen 1996. 3 Vols. Aberdeen. Vol. 3, p. 373-378 Sobanski, I. (2000) -- Die Eigennamen in den Detektivgeschichten Gilbert Keith Chestertons: Ein Beitrag zur Theorie und Praxis der literarischen Onomastik. Leipzig. 10 april 2012 19