FACULTEIT Letteren en Wijsbegeerte Vakgroep Toegepaste Taalkunde TERMINOLOGICAL VARIATION IN MULTILINGUAL EUROPE. THE CASE OF ENGLISH ENVIRONMENTAL TERMINOLOGY TRANSLATED INTO DUTCH AND FRENCH Proefschrift voorgelegd voor het behalen van de graad van Doctor in de Toegepaste Taalkunde door Koen Kerremans Academiejaar 2013 2014 Promotoren: Prof. dr. Rita Temmerman Prof. dr. Katja Lochtman
Vrije Universiteit Brussel Faculteit Letteren en Wijsbegeerte Vakgroep Toegepaste Taalkunde Pleinlaan 5 1050 Brussel http://www.vub.ac.be/toegepastetaalkunde
Abstract (En) In this study, terminological variation pertains to the different ways in which specialised knowledge is expressed in written discourse by means of terminological designations. Both variation in the use of terms in source texts (intralingual variation) and variation in the translation of these terms (i.e. interlingual variation) in target texts can be motivated on different grounds. For translators, it is therefore essential to have access to various alternatives for expressing specialised knowledge and to be able to find out which option(s) fit best in the context of the translation. Translators often consult bi- or multilingual translation resources (e.g. bilingual glossaries, parallel word lists, specialised translation dictionaries, terminological databases, etc.) to find solutions to certain translation problems. However, such structured resources never fully cover or describe the wealth of options available in language. By separating terms from their natural environment (i.e. the texts in which they figure), a lot of valuable information on which translation decisions should be based is lost. This is why translators also often resort to unstructured resources : i.e. texts originally written in the source and target languages or previously translated texts. In the present study, it is shown that the representation of intra- and interlingual variation in existing multilingual termbases is too restrictive to account for the wealth of potential linguistic options to express units of specialised knowledge in source and target texts. A new type of translation resource is proposed in which intra- and interlingual variation retrieved from parallel texts (i.e. source texts and their translations) is structured according to semantic and contextual criteria. With respect to the creation of the translation resource, a semi-automatic procedure is proposed for identifying term variants and their translations by applying semantic, textual and contrastive perspectives to analyses of parallel texts.
With respect to the underlying motivation for creating the translation resource, two descriptive case studies were carried out in order to examine a) how intra- and interlingual variation appears in a corpus of parallel texts and b) how intra- and interlingual variation is accounted for in the EU multilingual terminology base IATE. Texts in three languages are examined either belonging to the EU legislative framework or EU (non-legal) texts written for the general public. Apart from EU texts, also scientific reports published by a non-eu institution are included in this study. All texts (both EU and non-eu texts) were drafted in English and translated into Dutch and French. Four main subject areas within the environmental domain were selected for this study: biodiversity, climate change, environmental pollution and invasive alien species. With respect to the possible application and use of the translation resource, the study involves a reflection on how terms and equivalents recorded in multilingual terminological databases (multilingual termbases or MTBs) can be extended with intra- and interlingual variants retrieved from source and target texts. A graph representation is proposed in which intra- and interlingual variants in the translation resource are directly linked to one another in a contextually conditioned network of meaning potentials instead of indirectly via a separate level of meaning, as is the case in existing multilingual terminological databases.
Abstract (Nl) In deze studie heeft terminologische variatie te maken met de verschillende manieren waarop gespecialiseerde kennis wordt verwoord in het geschreven discours door middel van terminologische benamingen. Zowel variatie in het gebruik van termen in bronteksten (intralinguale variatie) als variatie in de vertaling van deze termen (interlinguale variatie) in doelteksten kan op verschillende manieren gemotiveerd worden. Voor vertalers is het om die reden essentieel om te weten welke verschillende alternatieven er zijn om gespecialiseerde kennis te verwoorden en om te kunnen achterhalen welke optie(s) het beste passen in de vertaalcontext. Vertalers consulteren vaak bi- of multilinguale naslagwerken (bv. bilinguale glossaria, parallelle woordenlijsten, gespecialiseerde vertaalwoordenboeken, terminologische databanken, enz.) om oplossingen te vinden voor bepaalde vertaalproblemen. Dergelijke gestructureerde bronnen kunnen nooit volledig de veelheid aan opties weergeven of beschrijven die er in taal aanwezig zijn. Door termen uit hun natuurlijke omgeving te halen (nl. de teksten waarin ze voorkomen) gaat er veel waardevolle informatie verloren waarop vertaalbeslissingen gebaseerd kunnen zijn. Om die reden kijken vertalers ook vaak in ongestructureerde bronnen. Dit zijn teksten gesteld in de bron- en doeltalen of eerdere vertalingen. In deze studie wordt aangetoond dat de representatie van intra- en interlinguale variatie in bestaande meertalige terminologische databanken onvoldoende blijkt om de veelheid aan mogelijke linguïstische opties weer te geven waarmee gespecialiseerde kennis wordt uitgedrukt in bron- en doelteksten. Een nieuw type van vertaalnaslagwerk wordt voorgesteld waarin intra- en interlinguale variatie uit parallelle teksten (dit zijn bronteksten en hun vertalingen) wordt gestructureerd volgens semantische en contextuele criteria.
Voor de ontwikkeling van dit vertaalnaslagwerk wordt een semiautomatische procedure voorgesteld waarmee termvarianten en hun vertalingen uit parallelle teksten worden geëxtraheerd op basis van semantische, tekstuele en contrastieve analyses. De onderliggende motivatie voor het vertaalnaslagwerk wordt beargumenteerd aan de hand van twee descriptieve gevalstudies die werden uitgevoerd om na te gaan a) hoe intraen interlinguale variatie in een corpus van parallelle teksten voorkomt en b) hoe intra- en interlinguale variatie wordt weergegeven in IATE, de meertalige terminologische databank van de EU. Teksten in drie talen werden onderzocht, waarvan sommige tot het EU wetgevend kader behoren. Bij andere gaat het om EU (niet-juridische) teksten die geschreven werden voor een breed publiek. Naast EU teksten, werden ook wetenschappelijke rapporten afkomstig van een niet-eu instelling in de studie opgenomen. De oorspronkelijke versies van alle teksten (zowel EU als niet-eu teksten) waren in het Engels opgesteld en nadien vertaald naar het Nederlands en het Frans. Vier belangrijke onderwerpen binnen het milieudomein werden geselecteerd voor deze studie: biodiversiteit, klimaatverandering, milieuverontreiniging en invasieve uitheemse soorten. Voor wat betreft de mogelijke toepassing en het gebruik van het vertaalnaslagwerk wordt er in deze studie gereflecteerd over de manier waarop termen en equivalenten in meertalige terminologische databanken (meertalige termenbanken of MTBen) kunnen aangevuld worden met intra- en interlinguale varianten uit bron- en doelteksten. Een grafische weergave wordt voorgesteld waarin intra- en interlinguale varianten in het vertaalnaslagwerk rechtstreeks aan elkaar gekoppeld worden in een context-afhankelijk netwerk van betekenismogelijkheden in plaats van onrechtstreeks via een apart niveau van betekenis, zoals meestal het geval is in bestaande meertalige terminologische databanken.