En de beste gratis online vertaalmachine is



Vergelijkbare documenten
Vragenlijst: Wat vind jij van je

Werkschrift : Hoe werk ik op WikiKids?

Als eerste bedankt voor het aanschaffen van deze PDF waarin ik je handige tips en trucs zal geven over het schrijven van een handleiding.

HANDLEIDING EUROGLOT TRANSLATOR MODULE

Technische vertaling: accuraat en compleet

Hoe te leren voor de UNIT toetsen

GOUDEN TIPS voor Professioneel Relatiebeheer

JAARGANG 9 / NUMMER 1 SEPTEMBER Mede mogelijk dankzij:

Les 4: Les conversatie + grammatica Nederlands Conversatie Les 2 A-klas

Week 2 Geld Verdien Machine. Ik heb een markt en nu??

Rapportage Werksoorten. Bea het Voorbeeld. Naam: Datum:

Uw vertaling van begin tot eind

PLUSLESSEN MAVO

Onderzoek Veilig of niet?

Actielessen. Lesbrief 3. Leren in de bibliotheek. Wat leert u in deze les? Veel succes!

Dwerggras 30, Rotterdam. 1. Schrijf tijdens het kijken dingen op die jou belangrijk lijken. Je hebt dit later nodig.

Dit ebook heb ik geschreven op 28/10/2013 van 8:26 uur tot 9.58 uur

ZEG HET MAAR HET PRATEN VAN UW KIND. Leeftijd vanaf 4 jaar

Inhoudsopgave. GAnalytics Trainingen. Brochure Google Analytics training

ICT Publisher

Virgo + WPS Office. Tabletproject

Bijlage interview meisje

Gebruikershandleiding Vertaalplatform externe revisor

Analyse en bespreking van 4 mogelijke technieken om de kwaliteit te verbeteren

Onderzoek Wereldproblemen en Seks

Leerstijlentest van David Kolb Davy Jacobs, GDD1B

Overtuigend en Ontspannen Presenteren

Profiel van informatiezoekers

Voorwoord. Veel succes met de schrijftraining! Amsterdam, februari Freek Bakker Joke Olie. 6 Voorwoord

ATTRIBUEREN OF TOESCHRIJVEN

Vragen & Antwoorden EU aanbesteding Vertaaldiensten, ref.: COR/LEG/DM/NV

Deze vragenlijst bestaat uit 17 vragen. Het invullen daarvan duurt ongeveer twintig minuten.

Introductie Bèta versie

Onderzoek Inwonerspanel: Maatschappelijke stage (MAS)

Dit document hoort bij de training voor mentoren blok 4 coachingsinstrumenten, leerstijlen.

SLIMSTAMPEN HANDLEIDING

Iedereen online, van 9 tot 99 jaar. Les Google: zoeken op het internet. Deze iconen tonen aan voor wie het document is

Les 3. Familie, vrienden en buurtgenoten

10 DIRECT TOEPASBARE TIPS VOOR MEER KLANTEN

Inhoudstafel Luistermoment La J Kinderen Lees dit alvorens te beginnen... 2 Doel van de activiteit... 2 Overzicht... 2 Praktische voorbereiding...

Ola Lanko en haar foto-genic installaties 14 oktober interview

10 DIRECT TOEPASBARE TIPS VOOR MEER KLANTEN

HANDLEIDING EUROGLOT TRANSLATOR MODULE

MEEST GEMAAKTE FOUTEN IN HET CV

Waarom ga je schrijven? Om de directeur te overtuigen

HEY WAT KAN JIJ EIGENLIJK GOED? VERKLAP JE TALENT IN 8 STAPPEN

GESPREKKEN VOEREN NEDERLANDS AAN HET EINDE VAN DEZE UITLEG:

Privacy instellingen voor Facebook Alles wat je op Facebook zet is openbaar. Wil je dat ook?

INSCHRIJVEN VOOR DE TAALTEST

feedback Flexibel en online Robuust 360º Werkboek Robuus Hartelijk dank voor het gebruiken van Robuust 360º Haal het maximale uit 360º

De loopbaanchecklist

Gebruiksvriendelijkheid: Gebruiksaanwijzing:

Onderzoek Je wordt 18 jaar en dan? De gevolgen voor je geldzaken

Woordentrainer Frans Cap sur le français 1 Handleiding versie 1.1

Wat maakt WizeNote uniek?

Online Titel Competentie Groepsfase Lesdoel Kwink van de Week

Stappenplan voor een onderzoek

Mijnkmosite Support Guide

1. Ik merk vaak dat ik probeer iets te bereiken wat op de een of andere manier op een mislukking uitloopt

Ik weet dat het soms best wel allemaal wat ingewikkeld kan lijken.

Workshop voorbereiden Authentieke instructiemodel

Hoe voer ik een onderzoek uit? Een stappenplan om te helpen een onderzoek uit te voeren.

Rapportgegevens Kerntyperingtest

Latijn: iets voor jou?

Thema Op zoek naar werk

7 gratis tips : ABSToRACT ntdek SCHILDER je eigen stijl EN

10 Gouden Tips voor Professioneel Relatiebeheer

10 onderdelen die niet mogen ontbreken in een online briefing

werkblad Scheldeberoep verkennen Veel beroepen hebben met de Schelde te maken. Welk beroep zou jij verder willen verkennen?

i n h o u d Inhoud Inleiding

Waarom ga je schrijven? Om de directeur te overtuigen

Vragenlijst Depressie

*Ook met het programma Paint van Windows kunnen foto s bewerkt worden

Master in het vertalen

Leer hoe je effectiever kunt communiceren

Teken een architect. Lees het volgende verhaal:

Rapportgegevens Nederlandse persoonlijkheidstest

De rol van de multinationale taaldienstenonderneming in dekwaliteitsproductie.

CURRICULUM VITAE. 1. Doel van een cv. 2. Lay-out. 3. Lengte

Office Live Workspace

Themaboek IBL1 - Internationaal marktanalist

Ik-Wijzer Ik ben wie ik ben

[PILOT] Aan de slag met de Hoofdzaken Ster

Assessment & Ontwikkeling

COMMUNICATIE EN INFORMATIE ONDER JONGEREN

Inhoud. 1 Wil je wel leren? 2 Kun je wel leren? 3 Gebruik je hersenen! 4 Maak een plan! 5 Gebruik trucjes! 6 Maak fouten en stel vragen!

Aflevering 2: Solliciteren

Persoonlijk Actieplan voor Ontwikkeling

Over ALS spreken. Inhoud. Wat is ALS? 1. Waardoor wordt ALS veroorzaakt? 1. Wat doet ALS met een patiënt? 1. Hoe kan je jouw vriend(in) bijstaan?

Aan de slag met MailChimp!

Soms kan het nuttig zijn verkeerde gespelde eigennamen te laten opzoeken en te vervangen via de functie Bewerken vervangen

Maak meer gebruik van je talenten!

Communiceren is teamwork

SNELHEID VS. KWALITEIT: SCHUILT ER WEL WINST IN HET

Zit de online burger wel online op u te wachten? Door: David Kok

Drie domeinen van handelen: Waarnemen, oordelen en beleven

ONDERZOEK VOOR JE PROFIELWERKSTUK HOE DOE JE DAT?

Uitgebreide versie. Mijn gegevens veilig bij Pluryn. Privacy Reglement

Transcriptie:

En de beste gratis online vertaalmachine is Ja, de gratis vertaalmachine van Google is de bekendste. Maar is het ook de beste? En als je de kwaliteit niet vertrouwt, kun je daar dan als leek zelf iets aan doen? Of is Bing dan toch beter? Klopt het dat je (nog) beter Spaans krijgt als de vertaalmachine je Nederlandse zinnen eerst in het Engels voorvertaalt en dan uit het Engels in het Spaans vertaalt? Helpt het als je je zinnen zelf voorvertaalt in het Frans, ook als je Frans niet helemaal top is? Yanah Van Geerteruy studeert meertalige communicatie aan de Universiteit Gent. Tijdens haar zomerstage nam ze twee weken de tijd om het uit te pluizen. Wat ze vond, is niet wereldschokkend maar wel verrassend. Haar onderzoekje suggereert minstens dat meer en grondiger onderzoek nuttig kan zijn. Ola María? Het is weer zomer. De warme temperaturen en de volle terrasjes doen je denken aan je heerlijke vakantie vorig jaar in Spanje. Barcelona. Antoni Gaudí. En de Montjuïc. Om dan nog te zwijgen over María, de gastvrouw bij wie je logeerde. Als je terugdenkt aan hoe zij jou verwende, krijg je meteen weer een warm gevoel. Dan besluit je haar een e-mail te sturen om te zeggen dat je haar deze zomer graag opnieuw een bezoekje zou brengen. Er is echter één probleem. Je Spaans is niet al te best, en zoals iedereen weet, hebben de Spanjaarden niet veel kaas gegeten van het Engels. Hoe pak je dit aan? Gratis online vertaalmachines de oplossing? Iedereen kan zich in de situatie inleven: je hebt iets te vertellen aan iemand die jouw moedertaal niet spreekt en die ook geen kennis heeft van het Engels, in zulke situaties meestal de voertaal. Zijn online vertaalmachines de oplossing? Vertaalmachines genoeg, maar wat zijn ze waard? Google Translate is de bekendste, maar is het ook de beste? Omdat niemand graag een mal figuur slaat, leek het me interessant om een klein onderzoek op te zetten: welke online vertaalmachine levert de meest correcte vertaling? Creatief met vertaalmachines Met welke ingrepen kun je die machinevertaling eventueel zelf nog verbeteren? Concreet: helpt het als je je oorspronkelijke input eerst vertaalt in een taal die couranter is dan je moedertaal (zoals het Engels couranter is dan het Nederlands)? En helpt het als je je oorspronkelijke input eerst vertaalt in een andere (eventueel courantere) taal die al tot dezelfde taalfamilie als je doeltaal (bv. Frans en Spaans) behoort? Yanah Van Geerteruy En de beste vertaalmachine is p 1

En: doe je dat voorvertalen beter zelf ook als je Engels of je Frans niet top zijn of kun je ook daarvoor beter de vertaalmachine inzetten? Dat is wat ik allemaal wilde weten. Voor mijn onderzoek heb ik de vertaalmachines Google Translate, Bing Translator en Intertran geselecteerd. Ik koos verder voor Nederlandse input en Spaanse output en voor Engels en Frans als bijkomende talen voor de voorvertaling. Om de kwaliteit van de vertalingen objectief te kunnen vergelijken, heb ik met een internationaal gerenommeerd puntensysteem gewerkt. Verder in dit artikel bespreek ik uitvoerig hoe ik te werk ben gegaan. En de beste is En de beste vertaalmachine is? De uitkomst van mijn onderzoek naar de beste gratis online vertaalmachine voor de talencombinatie Nederlands-Spaans is toch enigszins verrassend. Dit zijn de vier belangrijkste resultaten. 1. Vertaalmachine Bing Translator geeft de meest correcte output. 2. Werken met Bing Translator via het Engels naar het Spaans levert - zowel bij een menselijke als bij een machinale voorvertaling - een beter resultaat op dan rechtstreeks vanuit het Nederlands. 3. Werken via het Frans, een taal die tot dezelfde taalfamilie als het Spaans behoort, levert geen beter resultaat op. 4. Het beste resultaat in het Spaans krijg je met Bing Translator én als jijzelf dus niet de machine - de oorspronkelijke Nederlandse input voorvertaalt naar het Engels zelfs als je Engels niet top is. Vertalen en vertaalmachines: achter de schermen Een tekst vertalen, wat is dat eigenlijk? In essentie: een tekst in de ene taal omzetten in een tekst in een andere taal. De eerste tekst noemen we de brontekst, de tweede de doeltekst. Hoewel er veel verschillende visies bestaan over wat een goede vertaling is, gaan we er in dit artikel van uit dat een geslaagde vertaling de inhoud van de brontekst correct weergeeft in de doeltekst. Traditioneel doet de vertaler daarvoor vooral een beroep op zijn talenkennis, eventueel in combinatie met woordenboeken. Deze menselijke manier van vertalen kost echter veel tijd en geld. Daarom probeert men het vertalen de laatste jaren steeds meer te automatiseren. Dit betekent niet dat de menselijke vertaler overbodig is geworden. Dat zegt ook Lynne Bowker, professor aan de School of Translation and Interpretation in Ottawa, in haar boek Computeraided Translation Technology: Yanah Van Geerteruy En de beste vertaalmachine is p 2

Automatisch vertalen is het proces waarbij een computer de primaire verantwoordelijkheid voor de vertaling van een tekst heeft. Een mens kan helpen bij het proces door middel van taken zoals pre- of post-editing, maar het is de computer in plaats van de mens die een daadwerkelijke ontwerpvertaling produceert. (eigen vertaling) Mens versus machine Volgens professor Bowker doet een computer bij automatisch vertalen dus weliswaar het grootste werk, maar de menselijke vertaler kan nog altijd ingrijpen. Dat ingrijpen kan men dan echter niet langer vertalen noemen, maar eerder reviseren. De vertaler wordt hier dus eigenlijk revisor. We kunnen dus om te beginnen twee types van automatisch vertalen onderscheiden: de volledig automatische machinevertaling (Fully Automatic Machine Translation ofte FAMT) de door de mens ondersteunde machinevertaling (Human Aided Machine Translation ofte HAMT) Zoals professor Bowker aangeeft, kan de mens die de machinevertaling ondersteunt - de revisor dus - dat op twee manieren doen: hij kan de brontekst bewerken en hij kan de doeltekst bewerken. Pre-editeren In het eerste geval spreekt men van pre-editeren: de brontekst wordt zodanig aangepast dat de vertaalmachine minder moeite heeft met het omzetten. De onderzoekers Chris Callison-Burch en Philipp Koehn kwamen tot de vaststelling dat vertaalmachines vooral moeite hebben met woordvolgorde, dubbelzinnigheid op het vlak van structuur en woordenschat, gebruik van voornaamwoorden, en gebruik van de tijden. Het zijn dus vooral deze problemen waar de revisor bij het preediteren op moet letten. Postediteren In het tweede geval bewerkt de revisor niet de brontekst maar de doeltekst. Dan spreekt men van postediteren. Dit betekent dat de revisor de doeltekst grondig nakijkt. Hij moet dan opnieuw speciale aandacht hebben voor Callison-Burch en Koehns voornoemde problemen. Regels versus statistiek Vervolgens is het interessant om te weten dat vertaalmachines volgens verschillende principes kunnen werken. Ofwel is een vertaalmachine regelgebaseerd, wat inhoudt dat ze kennis heeft van de grammaticale regels van bron- en doeltaal. Een regelgebaseerde vertaalmachine Yanah Van Geerteruy En de beste vertaalmachine is p 3

is in staat om de verschillende grammaticale functies die woorden kunnen aannemen (bv. onderwerp en gezegde) te onderscheiden. Ofwel werkt een vertaalmachine volgens statistische methodes. Het uitgangspunt is dan dat elke zin of elk deel van een zin in één taal een mogelijke vertaling is van een zin of een deel van een zin in een andere taal. Tegenwoordig bestaan er ook hybride vertaalmachines die de regelgebaseerde en de statistische aanpak combineren. Ten slotte zijn er naast de reeds besproken volledig automatische machinevertaling (FAMT) en de machinevertaling die door de mens wordt ondersteund (HAMT) ook systemen ontwikkeld waarbij de computer de vertaler helpt bij het vertaalproces. Omgekeerd dus. We spreken dan van Machine Aided Human Translation (MAHT) of Computer-aided Translation (CAT). De brontekst wordt in dit geval vertaald door een menselijke vertaler, die een computer gebruikt om bijvoorbeeld de spelling te optimaliseren of de consistentie tussen verschillende vertalingen te bevorderen. Over mijn onderzoek Zoals gezegd zijn er vrij veel online vertaalmachines. Ik moest dus een selectie maken. Daarbij heb ik vooral gelet op de gratis beschikbaarheid en de bekendheid bij het brede publiek. Selecteren Uiteindelijk selecteerde ik de vertaalmachines Google Translate (statistische vertaalmachine), Bing translator (statistische vertaalmachine) en Intertran (regelgebaseerde vertaalmachine). Google Translate en Bing Translator liggen voor de hand. Google Translate is de meest gebruikte online vertaalmachine. Bing Translator is ontwikkeld door Microsoft, dat we kennen van Microsoft Office en de populaire tekstverwerker Word, waaraan Bing Translator is gekoppeld. Hergebruiken Mijn onderzoeksmethode heb ik zo eenvoudig mogelijk gehouden, zodat belangstellenden ze gemakkelijk kunnen hergebruiken om andere vertaalmachines te vergelijken of andere talencombinaties te evalueren. Minicorpus Om te beginnen heb ik een minicorpus samengesteld van negen Nederlandse zinnen die als input ter vertaling moesten dienen. Daarbij heb ik rekening gehouden met de typische problemen die Nederlandstaligen ondervinden als ze Spaans willen schrijven of spreken. Deze problemen lijken vooral betrekking te hebben op woordenschat en grammatica. Wat woordenschat betreft heb ik onderzocht welke vertaalmachine het beste overweg kan met collocaties (kleine, vaste woordgroepen), realia (feiten of zaken die uniek zijn voor een land, taal of cultuur), het geslacht van een bepaald woord en de keuze van het adequate woord. Wat Yanah Van Geerteruy En de beste vertaalmachine is p 4

grammatica betreft heb ik onderzocht welke vertaalmachine het beste resultaat geeft als het gaat om congruentie (bv. overeenkomst tussen onderwerp en werkwoord), het gebruik van ser en estar, het gebruik van de wijzen (bv. indicatief, conjunctief), het gebruik van de tijden en het gebruik van voorzetsels. De uitkomst van mijn onderzoek laat dus tevens zien welke problemen het best worden aangepakt door welke vertaalmachine. Objectief evalueren Vervolgens heb ik de output van de verschillende machines vergeleken. Om een objectieve vergelijking te kunnen maken, heb ik het internationaal gerenommeerde puntensysteem van SAE International gebruikt. Dit puntensysteem houdt niet alleen rekening met het aantal fouten in een vertaling, maar ook met de zwaarte van die fouten. Zo krijgt elke soort fout een precies aantal punten. Vervolgens moet men al deze punten optellen en delen door het aantal woorden in de brontekst. De vertaling die de laagste score heeft, heeft dus de beste kwaliteit. Een volledige analyse van de Spaanse vertalingen is in de eerste annex bij dit artikel te raadplegen. De uitkomst van mijn onderzoek laat dus tevens zien welke fouten het meest/minst gemaakt worden door welke vertaalmachine. De kwaliteit van machinevertaling zelf verbeteren? Hoe kun je als gebruiker zelf de output van een vertaalmachine verbeteren? Om die vraag te beantwoorden heb ik onderzocht of een voorvertaling van de oorspronkelijke Nederlandse input naar een andere inputtaal een gunstig effect heeft op de uiteindelijke Spaanse output. Concreet heb ik de effecten onderzocht van voorvertaling in het Engels en voorvertaling in het Frans. Beter met Engels? Mijn keuze voor het Engels is gebaseerd op de aanname dat vertaalmachines voor een belangrijke voertaal als het Engels een grotere databank hebben om gegevens uit op te halen, en dat ze bijgevolg correctere vertalingen zouden moeten kunnen leveren. Of beter met Frans? Voor het Frans heb ik gekozen omdat die taal tot dezelfde taalfamilie behoort als het Spaans. Mijn redenering is dat verwante talen meer grammaticale overeenkomsten moeten hebben, waardoor vertaalmachines correctere vertalingen zouden moeten kunnen leveren. Zelf vertalen of met de machine? Bij de Engelse en Franse input heb ik in mijn onderzoek ook een onderscheid gemaakt tussen enerzijds input vertaald door een vertaalmachine, en anderzijds input vertaald door een menselijke vertaler. Yanah Van Geerteruy En de beste vertaalmachine is p 5

In dit artikel wil ik bruikbare tips geven om betere machinevertalingen te verkrijgen. Ik heb daarbij de gemiddelde gebruiker voor ogen: de doorsnee Nederlandstalige met een gemiddelde kennis van Engels en Frans. Omdat ikzelf zo n gemiddelde gebruiker ben (en geen professionele vertaler), heb ik er zeer bewust voor gekozen om de zinnen zelf in het Engels en het Frans te vertalen in plaats van een beroep te doen op een professionele vertaler. Die zou wel beter Engels en beter Frans hebben geproduceerd maar hij kan niet model staan voor de gemiddelde gebruiker voor wie deze tips bedoeld zijn. Een volledige analyse van dit onderzoek naar mogelijke verbetertips is in de tweede annex bij dit artikel te raadplegen. En de beste is Bing Translator produceerde het meest correcte Spaans bij een Nederlandse input. Als we ook in detail bekijken hoe de vertaalmachines scoren op de specifieke grammaticale en woordenschatproblemen die ik voor de Nederlandse inputzinnen selecteerde, blijkt dat het opnieuw Bing Translator is die al deze problemen het meest correct vertaalt. Nochtans zou je kunnen verwachten dat de grammaticale problemen beter vertaald zouden worden door Intertran, aangezien deze vertaalmachine regelgebaseerd is. Yanah Van Geerteruy En de beste vertaalmachine is p 6

Bekijken we de problemen ten slotte afzonderlijk, dan kunnen we besluiten dat: syntactische fouten, fouten door verkeerde termen en interpunctiefouten die Nederlandstaligen typisch maken in het Spaans, het minst worden gemaakt door Bing Translator, typische spellingfouten en andere diverse typische fouten bij Nederlandstaligen het minst worden gemaakt door Google Translate, foute weglatingen in dezelfde mate voorkomen bij de drie vertaalmachines. Yanah Van Geerteruy En de beste vertaalmachine is p 7

Voor de Spaanse vertaling van Nederlandse zinnen komt dus Bing Translator als beste gratis online vertaalmachine uit ons onderzoek. Beter met Engels Ben je als doorsnee gebruiker bereid een inspanning te doen met het oog op een betere kwaliteit, dan geeft een voorvertaling naar het Engels een beter resultaat dan de oorspronkelijke Nederlandse input. Frans helpt niet Bovendien geeft de voorvertaling naar het Engels ook een correctere output dan een voorvertaling naar het Frans. Dit is op zich wel bijzonder, aangezien het Frans tot dezelfde taalfamilie als het Spaans behoort. Men zou dus bij deze laatste talencombinatie een beter resultaat kunnen verwachten. Frans helpt niet (2) Nog opmerkelijk bij de Franse voorvertaling is dat de Franse voorvertaling door de vertaalmachine een beter resultaat in het Spaans opleverde dan mijn eigen Franse voorvertaling. Aangezien ik zoals gezegd geen professionele vertaler ben, bevat mijn Franse vertaling ongetwijfeld nog grammaticale fouten. Toch verwachtte ik dat mijn menselijke voorvertaling uiteindelijk een betere Spaanse vertaling zou opleveren dan een machinale voorvertaling. Beter met Engels (2) Wat betreft de Engelse input, scoorde mijn eigen voorvertaling wél beter dan de machinale voorvertaling. Yanah Van Geerteruy En de beste vertaalmachine is p 8

Eindconclusie Bing Translator geeft de beste Spaanse vertaling uit het Nederlands. De beste manier om met Bing Translator een nog betere vertaling te verkrijgen, is door je Nederlandse brontekst zelf in het Engels voor te vertalen ook als je Engels niet top is. Meer weten? Neem gerust contact op met Yanah Van Geerteruy via Yanah.VanGeerteruy@UGent.be Yanah Van Geerteruy En de beste vertaalmachine is p 9