SNELHEID VS. KWALITEIT: SCHUILT ER WEL WINST IN HET



Vergelijkbare documenten
En de beste gratis online vertaalmachine is

Automatisch Vertalen SMT

Dutch Parallel Corpus Multilinguaal & multifunctioneel. Lieve Macken LT 3 Hogeschool Gent

Dutch Parallel Corpus Multilinguaal & multifunctioneel. Lieve Macken Hogeschool Gent

Een vertaalworkflow simuleren en evalueren. Departement Toegepaste Taalkunde Erasmushogeschool Brussel

DUTCH PARALLEL CORPUS EN SONAR

Onderzoek naar schrijfproceskenmerken bij MCI- en Alzheimerpatiënten

De toekomstige ISO vertaaldiensten norm. Totstandkoming en de belangrijkste wijzigingen t.a.v. EN 15038

Met de Glazen Bol naar. Doelgerichter BWT Toezicht

Cambridge Assessment International Education Cambridge International General Certificate of Secondary Education. Published

Doelstellingen van de Workshop

Verstrengeling van MT en TM

Universiteit Maastricht en WUR Ca 50 Maastricht en Ca 30 Wageningen Ronde 2 Datum uitvoering Mei Joke Marinissen en Gwen Noteborn

TAALTECHNOLOGIE 2.0: SENTIMENTANALYSE EN

How to present online information to older cancer patients N. Bol

Privacy by Design. De Toekomst. Jaap-Henk Hoepman. Privacy & Identity Lab Radboud University Tilburg University University of Groningen

Hoe te leren voor de UNIT toetsen

Cover Page. The handle holds various files of this Leiden University dissertation.

syllabilijst 1819 eerste sem lesgever opleidingsonderdeel code titel cursus auteurs opmerkingen

Technische vertaling: accuraat en compleet

SCRATCH KLANT AAN HET WOORD

Specialisten in juridisch

LiLa Portal Docentenhandleiding

Vertalen met (gratis) tools: de voordelen en valkuilen

Resultaten van de eerste MIM Snomed Hackathon

Master in het vertalen

Immigratie Studeren. Studeren - Universiteit. Aangeven dat u zich wilt inschrijven. Verklaren dat u graag wilt inschrijven voor een cursus.

Certificeringsproef Sociaal Vertalen

Hoe kunt u het spellingprobleem van uw studenten oplossen?

University of Groningen Educational value of digital examination

EU-Speak _ leslla docenten

Halma Bot: Monte Carlo versus Alpha-Beta

Uw vertaling van begin tot eind

DANKZIJ DIGITALE HULPMIDDELEN MEER LEESBEGRIP EN MINDER LEESANGST

Artificial Intelligence. Tijmen Blankevoort

Welkom! Doelstellingen van deze workshop. Véronique Hoste (Universiteit Gent) Khalid Choukri (ELRA/ELDA for ELRC)

identificeert de betekenis van woorden en de verbanden ertussen.

Het ideale font voor programmeurs

idf/iwf excel

Engels op Niveau A2 Workshops Woordkennis 1

DPC. Dutch Parallel Corpus. Corpus Design. Lidia Rura

Testing University. A fool with a tool is still a fool

Hardware Specialisatie. Module 1: Zoeken op het internet

Weighing costs versus benefits: evaluating the impact from implementing a course management system. Richard West University of Georgia

Parse and Corpus-based Machine Translation. STEVIN Programmadag

Do s & don t s van het tolken

ArchiMate voor kennismodellen van NORA en haar dochters. Marc Lankhorst 16 oktober 2013

Meertaligheid als institutionele uitdaging in het veld van de eerstelijnsgezondheidszorg. Stef SLEMBROUCK Vakgroep Taalkunde, UGent

General info on using shopping carts with Ingenico epayments

service design workshop

SAMENWERKING DGT- VERTAALOPLEIDINGEN

Welke factoren beïnvloeden het gezamenlijk leren door leraren? Een systematische literatuurreview Thurlings, M.C.G.; den Brok, P.J.

VOORBEELD VAN FEEDBACKRAPPORT SELOR TAALTEST

Curriculum vitae. Opleiding. Stage en scriptie. Klaar Vanopstal

EEN SIMULATIESTUDIE VAN DE SCHEDULE CONTROL INDEX

Digital municipal services for entrepreneurs

Initiatiefvoorstel Fractie Front Studieklimaat in de UB

Stochastiek 2. Inleiding in the Mathematische Statistiek. staff.fnwi.uva.nl/j.h.vanzanten

Immigratie Studeren. Studeren - Universiteit. Aangeven dat u zich wilt inschrijven. Verklaren dat u graag wilt inschrijven voor een cursus.

Developing an adaptive, diagnostic test of. English writing skills

To refer to or to cite this work, please use the citation to the published version:

Security theorie. Omdat theorie heel praktisch is. Arjen Kamphuis & Menso Heus arjen@gendo.nl menso@gendo.nl

Stijn Hoppenbrouwers en Tom Heskes. Onderzoeksmethoden (vervolg)

PDF hosted at the Radboud Repository of the Radboud University Nijmegen

Creatief Europa subprogramma Cultuur

PIA: niet omdat het moet, maar omdat het kan. Hoe kan de Privacy Impact Assessment ingepast worden in de onderzoeks data lifecycle?

EEN SEXTANT VOOR EEN TAALSPECIALIST

Proeftuinplan: Meten is weten!

" Inleiding: " Sectie GISt " GDMC " TUDelft " Case studies " Conclusies

The far side of the moon

Aanbod Erasmus-uitwisseling Vakgroep PP07 (ontw-pers-soc) Coördinator Wim Beyers

Autoconnect VIPS: Gebruikersgids (Vehicle Information Preregistration System)

Risk & Requirements Based Testing

Hoofdstuk 12: Spelling en grammatica

Engels Essay Onderwerpen - Essay Writing - (brennen)

USER EXPERIENCE ONDERZOEK Gastcollege 9 maart 2015

PDF hosted at the Radboud Repository of the Radboud University Nijmegen

LANGUAGE MANAGEMENT PEOPLE MANAGEMENT? Lieve Vangehuchten & Dieter Vermandere (Universiteit Antwerpen - dept. Taalkunde)

Tweetalig basisonderwijs in het Gooi. Learning Beyond Boundaries

FACTS & FIGURES Bibliotheekbezoek Franne Mullens

SCHOLEN DIE VERBINDEN Naar een beter begrip van de impact van binding en een autoritatief schoolklimaat op spijbelen

Sentimentanalyse voor online politieke berichtgeving

BiZZdesign. Bouwen van sterke en wendbare organisaties met behulp van standaarden, methode, technieken en tools. Research & Development

Alberta Language and Development Questionnaire (ALDeQ) Johanne Paradis, University of Alberta

TABASCO. Taak gestuurd leren bij Engels

Master in het vertalen

Eye tracking analyse van de visuele impact van windturbines in het landschap

Quick Start Guide Voor vertalers

Zoeken in een Afrikaans corpus: baie maklik! Liesbeth Augustinus Ineke Schuurman Vincent Vandeghinste Peter Dirix Frank Van Eynde

Office Live Workspace

Een beginners handleiding voor het opwekken van je eigen energie en er ook voor betaald worden.

Cursus Software evolution. Dr. Bastiaan Heeren Touw Symposium, 24 november 2012 Studiecentrum Amsterdam

Disseminatie: artikels schrijven, presenteren en publiceren. Katrien Struyven

Artificial Intelligence in uw dagelijkse praktijk. Hilversum, 22 September 2016

ScienceDMZ? DTN? RDZ? WTF? Bingo! Research Data Zone (RDZ) Project

math inside Model orde reductie

1. INLEIDING 2. LESMATERIAAL

Studentnummer: Inleiding Taalkunde 2013 Eindtoets Zet op ieder vel je naam en studentnummer!

Masterproeven Wireless & Cable Research Group (WiCa)

Teststrategie met behulp van heuristieken

Transcriptie:

141 SNELHEID VS. KWALITEIT: SCHUILT ER WEL WINST IN HET GEBRUIK VAN AUTOMATISCHE VERTAALSYSTEMEN? Joke Daems, Lieve Macken & Sonia Vandepitte De toenemende globalisatie zorgt voor een snel evoluerende vertaalsector. Zo steeg het vertaalvolume van het DGT van de Europese Commissie op acht jaar tijd met maar liefst een half miljoen pagina s (European Commission, 2005; European Commission, 2013). Het stijgende volume te vertalen materiaal leidt op zijn beurt tot een groeiend tekort aan vertalers. In een poging dit tekort op te vangen, probeert men onder andere gebruik te maken van automatische vertaalsystemen en de output ervan te verbeteren (of post-editen): dat proces zou immers sneller zijn dan het gebruikelijke manueel vertalen. De voorbije jaren is de kwaliteit van automatische vertaalsystemen er immers sterk op vooruitgegaan met de komst van statistische systemen. In 2009 al stelde het DGT het project MT@EC (European Commission) voor, dat vertaaldiensten zou leveren op basis van zulke statistische automatische vertaalsystemen. Nochtans bleek uit de cijfers van 2012 dat slechts 0,14% van de vertaaltaken van het DGT bestaat uit post-editing. Ook uit onze eigen bevraging bij zeventien masterstudenten vertalen (Engels) blijkt dat automatische vertaalsystemen nog lang niet ingeburgerd zijn: slechts 22% zegt vaak gebruik te maken van een automatisch vertaalsysteem. Hoewel de helft van de studenten gelooft dat post-editing sneller is dan manueel vertalen, lijken de studenten niet overtuigd te zijn van de kwaliteit: 67% gelooft dat manuele vertalingen van betere kwaliteit zijn, de overige 33% denkt dat er geen verschil in kwaliteit is. Maar hoe zit het nu echt? Is post-editing werkelijk sneller dan manueel vertalen en zo ja, gaat dit dan niet ten koste van de kwaliteit? Het zijn onder andere deze vragen waarop we binnen LT³ (de afdeling Taaltechnologie van de vakgroep Vertalen, Tolken en Communicatie aan de Universiteit Gent) door middel van het ROBOT-

142 project (LT³, 2012) een antwoord trachten te vinden. Hoewel eerder onderzoek erop wees dat post-editing bijvoorbeeld binnen softwarelokalisatie tot snellere vertalingen kan leiden (Guerberof, 2009; Plitt & Masselot, 2010; Tatsumi, 2010), is er weinig onderzoek over het gebruik van post-editing bij algemene teksttypes terug te vinden. Het is dan ook het doel van ons project om een beter inzicht te krijgen in beide vertaalprocessen en -producten, in beide vertaalrichtingen, zowel voor studenten als professionele vertalers. Binnen het ROBOT-project voerden we reeds twee voorstudies uit waarin we studenten een tekst lieten post-editen en een tekst lieten vertalen. In het eerste experiment werkten we met krantenartikelen, in het tweede met technische teksten. De resultaten van de tijdsanalyse waren behoorlijk eenduidig: post-editing was in beide studies voor iedere tekst gemiddeld sneller dan manueel vertalen. De kwaliteitsanalyse vormde echter een net iets ingewikkelder probleem. Bestaande metrieken voor kwaliteitsanalyse - zoals SAE J2450 (2001), LISA (2011) en EN-15038 (2006) - zijn weliswaar nuttig voor een snelle kwaliteitscheck binnen een bedrijf of vertaalbureau, voor een gedetailleerde analyse bleken ze minder bruikbaar. Vertrekkend van bestaande categorieën besloten we dan ook een eigen methodologie voor de analyse van vertaalkwaliteit uit te werken. We splitsten de analyse op in twee aspecten: aanvaardbaarheid (acceptability) en adequaatheid (adequacy), naar de verdeling van Toury (1995). De aanvaardbaarheid van een tekst wordt bepaald door de mate waarin de regels van de doeltaal en de doeltekst gerespecteerd worden: grammatica, lexicon, spelling, stijl, cohesie. De adequaatheid van een tekst wordt bepaald door de mate waarin de boodschap van de brontekst werd overgebracht in de doeltekst: tegenstellingen, woordverschuivingen, verkeerde woordbetekenis, toevoegingen, weglatingen, Bij het toepassen van onze methodologie op de vertalingen van de studenten, werd één ding meteen duidelijk: de analyse van vertaalkwaliteit is een bijzonder complexe taak, niet alleen

143 kwalitatief maar ook kwantitatief. Hoewel er twee annotatoren/evaluatoren waren, werd meer dan de helft van de problemen maar door één van beide aangeduid. Dit had enerzijds te maken met subjectiviteit (sommige personen zijn strenger dan andere 1 ), anderzijds ook met complexiteit (er zijn heel veel problemen waar je zo overheen leest). Na een consolidatiefase was de overeenkomst heel wat groter, en op basis van die overeenkomst konden we de verschillende vertaalfouten en -problemen in detail analyseren. Op hoog niveau kunnen we alvast stellen dat bij studenten postediting van algemene teksten zeker niet tot een slechtere kwaliteit leidt dan manueel vertalen, hoewel de eerstgenoemde vertaalmethode duidelijk sneller is. Bij manueel vertalen zijn adequaatheidsproblemen couranter dan bij post-editing, bij postediting zijn aanvaardbaarheidsproblemen dan weer couranter. Opvallende verschillen vinden we ook wanneer we naar de meest voorkomende categorieën kijken bij beide vertaalmethodes: zo vormen woorddesambigueringsproblemen bijna 10% van alle posteditingfouten, in vergelijking met slechts 5% van alle problemen bij manueel vertalen. Weglating is dan weer een probleem dat vooral bij manueel vertalen courant blijkt te zijn (7% van alle manuele vertaalfouten in vergelijking met 4% van alle post-editing fouten). Vooral opmerkelijk is het feit dat de problemen die na het postediten bleven staan vaak problemen waren waarvan we hadden verwacht dat ze een post-editor meteen zouden opvallen: Zo werd het begin van de zin Claims of apparent cure by novel treatment strategies or even by unconventional medicine or 'faith healing' should be seen in an appropriate context vertaald als: Vorderingen van schijnbare genezing of bleven er zinnen staan met congruentieproblemen: Simulaties worden direct in de interne 1 Er is echter wel een correlatie tussen de beoordelingen van strenge en minder strenge evaluatoren (r=0.89, n=38, p<0.001 voor aanvaardbaarheid en r=0.70, n=38, p<0.001 voor adequaatheid).

144 indeling van de editor opgenomen en kan later als gebruikelijk frames worden bewerkt. De hoeveelheid fouten die opvallend vaak terugkeren bij het postediten van automatisch gegenereerde vertalingen zou op enkele manieren gereduceerd kunnen worden. Zo zouden post-editors getraind kunnen worden om deze specifieke fouten te herkennen of zou het automatische vertaalsysteem kunnen leren van de aanpassingen die een vertaler maakt, zodat steeds terugkerende problemen (zoals incongruentie) niet langer over het hoofd gezien worden. Binnen LT³ zijn er een aantal projecten die kunnen bijdragen aan de verbetering van de kwaliteit van automatische vertaalsystemen en post-editing (zie http://www.lt3.ugent.be/en/projects/ voor meer informatie over ieder project). Zo werkte Els Lefever in het project ParaSense (Parallel Corpora for Word Sense Disambiguation) rond woordbetekenisdesambiguering. Aangezien desambigueringsproblemen zo n 10 procent uitmaakten van alle gemaakte post-editingproblemen uit onze voorstudie, zou onderzoek naar woordbetekenisdesambiguering zeker de kwaliteit van automatische vertaalsystemen en/of post-editing kunnen verbeteren. Ook binnen het ROBOT-project voeren we verder onderzoek naar het vertaal- en post-editingproces. Aan de hand van tools zoals eye-tracking (het registreren van oogbewegingen) en toetsregistratie zullen we onderzoeken hoe het post-editingproces verschilt van het reguliere vertaalproces. Een van de mogelijke toetsregistratietools is Inputlog (www.inputlog.be), waarvoor LT³ in het project Inputlog++ een extensie ontwikkelde waarmee procesdata verrijkt kunnen worden met taalkundige informatie (Macken et al., 2012). Daarnaast zal ook het SBO-project SCATE een grote impact hebben op de interactie tussen vertaler (of post-editor) en output van een automatisch vertaalsysteem. Binnen het SCATEproject wordt een vertaalomgeving ontwikkeld waarbinnen de samenwerking tussen mens en computer geoptimaliseerd wordt. Er

145 wordt onder andere gekeken naar typische post-editingproblemen en post-editinginspanning. Op basis van die gegevens is het de bedoeling om de post-editinginspanning a priori te bepalen, zodat de vertaalomgeving enkel een automatische vertaalsuggestie aanbiedt als die suggestie ook een meerwaarde (tijdswinst zonder grotere cognitieve belasting) met zich meebrengt voor de vertaler. Referenties EN 15038. (2006). Translation services - Service requirements. European Commission. (2005). Translation in the Commission: where do we stand eight months after the enlargement? MEMO/05/10. [Online] http://europa.eu/rapid/press-release_memo-05-10_en.htm#fn1 European Commission. (2009). Machine Translation Service MT@EC. [Online] http://ec.europa.eu/isa/actions/02-interoperabilityarchitecture/2-8action_en.htm European Commission. (2013). Translation in figures - 2012. [Online] http://ec.europa.eu/dgs/translation/whoweare/translation_figures_ en.pdf Guerberof, A. (2009). Productivity and quality in MT post-editing. Paper presented at the MT Summit XII -Workshop: Beyond Translation Memories: New Tools for Translators MT, Ottawa, Ontario, Canada. Localization Industry Standards Association. LISA QA Model 3.1. Geraadpleegd via www.lisa.org/lisa-qa-model-3-1.124.0.html LT³. (2012). Robot. [Online] http://www.lt3.ugent.be/en/projects/robot/ Macken, L., Hoste, V., Leijten, M., & Van Waes, L. (2012). From keystrokes to annotated process data: Enriching the output of

146 Inputlog with linguistic information. Paper presented at LREC 2012, Istanbul. Plitt, M., & Masselot, F. (2010). A Productivity Test of Statistical Machine Translation Post-Editing in a Typical Localisation Context. The Prague Bulletin of Mathematical Linguistics, 93, 7-16. SAE J2450. (2001). Quality Metric for Language Translation. [Online] www.apex-translations.com/documents/sae_j2450.pdf Tatsumi, M. (2010). Post-Editing Machine Translated Text in a Commercial Setting: Observation and Statistical Analysis. Dublin: Dublin City University. Toury, G. (1995). The Nature and Role of Norms in Translation. In Toury, G., Descriptive Translation Studies and Beyond (pp.53-69). Amsterdam/Philadelphia: John Benjamins.