Het Nederlands en Taal en Spraaktechnologie

Vergelijkbare documenten
Vervolg op het STEVIN Programma

Spreekvaardigheidstraining met behulp van Automatische Spraak-Herkenning (ASH)

DPC. Dutch Parallel Corpus. Corpus Design. Lidia Rura

Doelstellingen van de Workshop

In de beleidsnota staat dat de Vlaamse kennisinstellingen opvallend veel samenwerken met de bedrijfswereld.

THE DUTCH LANGUAGE IN THE DIGITAL AGE HET NEDERLANDS IN HET DIGITALE TIJDPERK. Jan Odijk Universiteit Utrecht. White Paper Series.

De positie van het Nederlands in Taal- en Spraaktechnologie. Gosse Bouma en Ineke Schuurman

THE COMPLETE DOCUMENT MANAGEMENT SOLUTION

Dutch Parallel Corpus Multilinguaal & multifunctioneel. Lieve Macken Hogeschool Gent

SESSIE 5: MARKTEN EN COMPETENTIES

Dutch Parallel Corpus Multilinguaal & multifunctioneel. Lieve Macken LT 3 Hogeschool Gent

Spraaktherapie in e-health: spraaktechnologie en gaming

DUTCH PARALLEL CORPUS EN SONAR

ELRC Workshop in Nederland. Steven Krauwer / Jan Odijk Utrecht University. ELRC+ Workshop, [Country], [Date] 1

[Dossier] Taal- en spraaktechnologie in Vlaanderen: dood of levend? Els Lefever en Lieve Macken. <foto s auteurs: zie gelijknamig bestand>

BigHand Professional

De digitale kiosk: Collectieve digitale distributie van content van Vlaamse & Nederlandse cultuurtijdschriften

Resultaten en Beschikbaarheid 1e Ronde projecten, SPRAAK en CORNETTO Jan Odijk i.s.m. TST-Centrale

Enquête crowdsourcing knaw voor onderzoekers en collectiebeheerders

SMART SCHOOLS PROJECTOPROEP 2018

Actieplan voor het Nederlands in taal- en spraaktechnologie

GEVAAR VOOR ONZE TALEN EN EEN UITDAGING VOOR TAALTECHNOLOGIE

Eerste Snapshot: tussentijdse analyse van de Vlaamse deelname aan het Europese Zesde Kaderprogramma voor Onderzoek (7 november 2005)

Inleiding tot het debat

SESSIE 3: MAATSCHAPPELIJKE EN SOCIALE RELEVANTIE

Industrie 4.0 presentatie Vlaams parlement. 18 mei 2017 Leo Van de Loock

CLARIN-NL Metadataproject

Een inleiding tot taaltechnologie

uitgroeien tot een Vlaamse, Europese en internationale topregio met economische creativiteit als concept voor meer welvaart en welzijn in de regio.

Project 'Smart tooling procesindustrie'

Krimp. Gevolgen voor het hoger onderwijs en de marketingstrategie

ANNEX BIJLAGE. bij. voorstel voor een BESLUIT VAN DE RAAD

Verbeter uw organisatie met behulp van uw stem

[WORLD WIDE WEED] Gevonden artikelen Periode 03 Feb, Feb, Rapportdatum 09 Feb, Op de doelberichten van WorldWideWeed

Meertaligheid als kerncomponent van internationale competentie. Lies Sercu KU Leuven

Faculteit Letteren. Infodag: woensdag 6 september 2017 CAMPUS SINT-ANDRIES ANTWERPEN. Programma infodag. Bereikbaarheid

MONITOR DRAADLOZE TECHNOLOGIE. Presentatie voor NFO overleg oktober 2018 Toon Norp

Workshop Schrijf een artikel(voor Limosa)

Paul Zeeuwts Directievoorzitter. Symposium VVBB 24 oktober 2005

Achterhoek 2020 Tom van der Horst, TNO 28 januari

Customer experience in het digitale tijdperk

Faculteit Letteren. Infodag: zaterdag 11 maart 2017 CAMPUS SINT-ANDRIES ANTWERPEN. Programma infodag. Bereikbaarheid

Historie maritieme sector

Profiteer van veranderende technologieën

Bachelor Europese Studies overgang naar Propedeuse. Oude programma tot en met 2011/12 Nieuwe programma vanaf 2012/13.

Wereldwijd arbeidsmarktonderzoek bekendheid Eindhoven & Brainport Eindhoven Region

Commissie interne markt en consumentenbescherming. van de Commissie interne markt en consumentenbescherming. aan de Commissie vervoer en toerisme

What really works in the classroom Actieve werkvormen & taaltaken KA Etterbeek

The Netherlands of

Draadvrije communicatie voor de campus(gebruikers)

Witboekserie. White Paper Series THE DUTCH LANGUAGE IN THE DIGITAL AGE HET NEDERLANDS IN HET DIGITALE TIJDPERK. Jan Odijk

SWOT-ANALYSE. SWOT en confrontatiematrix aangeboden door 1

Brief aan Hans Dijkman Brief aan Han Smits De plek van het Design Institute: de analyse

Technologieverkenning Nederlandstalige Taalen Spraaktechnologie

The Netherlands of

BEST VALUE PROCUREMENT, HOE WERKT DAT IN DE PRAKTIJK? CASE CLOUD NATIVE ARCHITECTURE ENEXIS CORINE VAN WEIJEN

HIB-seminar 4 juni 2015 Internationalisering doe je samen: de docent maakt het verschil TAAL & INTERNATIONALISERING Maike Verhagen & Marion Hemsing

The digital transformation executive study

Samenwerking in de Toeleveringsketen. Hans Simonse Nevat EMS Technologie Groep Halin electronics BV

Europese InnovatieStimulering (EIS) Mogelijkheden voor onderzoek in internationale context

Het is tijd voor Kleos

Benchmark uw. productielogistiek. Productiebedrijven in Vlaanderen. met uitsterven bedreigd. springlevend

The Digital Transformation Executive Study

Een Smart Industry is een industrie met (productie)faciliteiten die een maximale flexibiliteit realiseren met betrekking tot:

Op het einde van de negentiende eeuw werd het Nederlands een van de officiële talen in België. Maar welk Nederlands? Er waren twee kampen.

Creëren van een innovatief Europa Verslag van de Onafhankelijke Expertengroep inzake O&O en innovatie, aangesteld na de top van Hampton Court

Het kan wél! Mirjam Blumenthal Elif Borucu-Çalinalti Richard Burne Jet Isarin. Siméa, 11 april Samen sterk in communicatie

TAALUNIE Taal schept kansen. Strategisch plan

Autonomata, Too. Henk van den Heuvel. CLST, Radboud Universiteit Nijmegen

door Jeff Kinney De Fontein Jeugd

DUURZAAMHEIDSMETER WIJKEN voor de (her)ontwikkeling van woongebieden in Vlaanderen versie 1.0 THEMA 9 INNOVATIE

26 mei Begrotingsopmaak 2016

TST-rondetafel 07/09/2011

The Netherlands of

22 mei 2010 ÉÉN DAG EUROPEES PARLEMENTSLID

De E in STEM: van raadsel tot sleutel

Canon Essential Business Builder Program. Combineert alles wat u nodig hebt voor zakelijk succes

Digitale zorg in regionale netwerken

Voorwaarden Shape formules

VIS traject. Duurzaam lasersnijden bij KMO s dankzij de nieuwe laserbronnen met hoog rendement. Ilse Dobbelaere, CLUSTA Mol, VITO, 2 oktober 2012

Nationale IT Security Monitor Peter Vermeulen Pb7 Research

De digitale leesinstructeur

Strategic Decisions Monitor

Master in de westerse literatuur. Masterinfoavond 7 maart 2018

En de beste gratis online vertaalmachine is

IPR regelingen binnen het STEVIN-programma

Bachelor Cognition, Language and Communication. uva.nl/ba-cognition-language-communication

Veilig mobiel werken. Workshop VIAG 7 oktober 2013

Het Communicatie Platform voor telefonie-, webchat-, - en WhatsApp routering voor eenvoudige en flexibele bereikbaarheid van uw organisatie

Digitale Ongelijkheid. Dr. Alexander van Deursen Vakgroep Media, Communicatie en Organisatie

Europese Innovatie Stimulering (EIS) voor ICT

35 jaar TST-beleid in de Lage Landen: en nu? Peter Spyns (EWI) & Alice Dijkstra (NWO) Peter.Spyns@ewi.vlaanderen.be & a.dijkstra@nwo.

DDMA PRIVACY MONITOR - DEEL TWEE DECEMBER 2018

Deze keuze maak je voor de algemene vorming: een pakket van 28 lesuren.

Educatief Professioneel (EDUP) - C1

The Netherlands of

SPAANSE TAAL EN LITERATUUR (ELEMENTAIR) HAVO

Vlaamse Raad voor Wetenscbapsbeieid

Europese EFRO-subsidies voor innovatie en CO 2 -reductie

Transcriptie:

Het Nederlands en Taal en Spraaktechnologie Amsterdam 18 Oktober 2012 Jan Odijk 1

Overzicht META-NET Studie Het Nederlands in de META-NET studie Het Nederlands in Nuance Spraaktechnologie De ontwikkeling van spraaktechnologie Conclusies 2

META-NET Studie Digitale ondersteuning voor 30 van de 80 talen gesproken in Europa Door META-NET Europees excellentienetwerk (60 onderzoekscentra, 34 landen) http://www.meta-net.eu Digitale ondersteuning door taal- en spraaktechnologie Technologie en toepassingen Spraakherkenning, spraaksynthese, grammaticale analyse, semantisch analyse, tekstgeneratie, automatisch vertalen Data en kennisbanken Tekstcorpora, spraakcorpora, parallelle corpora, lexicale taalbronnen (bijv. woordenboeken), grammatica s 3

META-NET Studie Vergelijking tussen de talen op vier gebieden Automatisch vertalen Spraakinteractie Tekstanalyse Beschikbaarheid van taalbronnen 4

META-NET Studie: Resultaten Beschreven in taalwitboeken http://www.meta-net.eu/whitepapers Digitaal en in papieren versie beschikbaar Belangrijkste resultaten 21 van de 30 talen: ondersteuning is niet-bestaand of zwak 4 daarvan: laagste score op alle gebieden (IJslands, Lets, Litouws en Maltees) Als er niets gebeurt dreigt de digitale uitsterving van deze talen! Geen enkele taal heeft excellente ondersteuning Alleen voor Engels is er goede ondersteuning 5

META-NET Studie: Quotes Voor de meerderheid van de Europese talen is er een ernstig gebrek aan taalbronnen en enkele worden bijna geheel verwaarloosd. In deze zin zijn vele van onze talen nog niet toekomstbestendig (prof.dr. Hans Uszkoreit, DFKI, Berlijn) Er zijn dramatische verschillen in taaltechnologische ondersteuning tussen de verschillende Europese talen en technologische gebieden. Het gat tussen de grote en de kleine talen blijft maar groter worden. We moeten ervoor zorgen dat we alle kleinere talen en talen met te weinig taalbronnen uitrusten met de noodzakelijke basistechnologie, anders zijn deze talen gedoemd digitaal uit te sterven (dr. Georg Rehm, DFKI, Berlijn) 6

META-NET Studie: Oproep Oproep voor een gezamenlijk programma van nationale overheden en Europa, van kennisinstellingen en industrie om te zorgen voor behoud van de meertaligheid in Europa ook in het digitale tijdperk De taal- en spraaktechnologie op een hoger plan te tillen De Europese meertaligheid tot een economische sterkte te maken Daartoe is ook een Strategische Onderzoeksagenda opgesteld http://www.meta-net.eu/sra Wordt in november officieel gepubliceerd 7

Overzicht META-NET Studie Het Nederlands in de META-NET studie Het Nederlands in Nuance Spraaktechnologie De ontwikkeling van spraaktechnologie Conclusies 8

META-NET Studie: Nederlands Het Nederlands in het Digitale Tijdperk Nederlands doet het niet zo slecht In dezelfde klasse als Frans en Spaans Behalve voor automatisch vertalen gematigd optimistisch 9

Nederlands Hoe komt het dat het Nederlands het zo goed doet? Door bewuste taalpolitiek om het Nederlands te versterken in de digitale informatiemaatschappij Gez. Nederlands-Vlaams programma STEVIN (2004-2011) Voor het creëren van Nederlandse taalbronnen Voor strategisch onderzoek naar Nederlandstalige taal- en spraaktechnologie Nauwe samenwerking tussen kennisinstellingen en industrie Nauwe samenwerking tussen Nederland en Vlaanderen http://taalunieversum.org/taal/technologie/stevin/ 10

Nederlands STEVIN programma is beëindigd Heeft excellente evaluaties door internationale en nationale experts Heeft grote hoeveelheden nieuwe data en technologie opgeleverd http://taalunieversum.org/taal/technologie/stevin/etalage/ http://taalunieversum.org/taal/technologie/stevin/documenten/s tevin_resultatenboek.pdf Spyns & Odijk (2012) Essential Speech and Language Technology for Dutch: Results by the STEVIN-programme. Springer Verlag. ISBN 978-3-642-30909-0. Preprint levert daarmee een uitstekende basis voor geavanceerd onderzoek aan de hand van de Nederlandse taal Waarmee de toekomst van het Nederlands in de digitale informatiemaatschappij bestendigd kan worden 11

Nederlands Er moet nu een vervolgprogramma komen om deze resultaten optimaal te benutten Om de digitale ondersteuning van het Nederlands te blijven waarborgen Er is hiervoor een concreet voorstel dat compatibel is met de META-NET Strategische Onderzoeksagenda Rapport (Nederlandse Taalunie) Presentatie 12

Overzicht META-NET Studie Het Nederlands in de META-NET studie Het Nederlands in Nuance Spraaktechnologie De ontwikkeling van spraaktechnologie Conclusies 13

Dragon NaturallySpeaking Bestaat in ca 8 talen En Nederlands zit daarbij! Hoe komt dat? Andere spraaktechnologie is er voor veel meer talen: TTS 40+ Vocon ASR 40+ Mobile Dictation: 35 Waarom dit verschil? 14

Talen in spraaktechnologie TTS Relatief kleine investering Bedrijven kunnen dat zelf opbrengen veel talen afgedekt ASR (netwerk, desktop, mobile) Grote investering Bedrijven kunnen dat niet voor alle talen zelf opbrengen Samenwerking tussen verschillende bedrijven Gedeeltelijk ondersteund door overheidsgeld SpeechDat familie van projecten 1995-2005 veel talen afgedekt 15

Talen in spraaktechnologie Desktop Dicteersystemen Zeer grote investering Er is niet samengewerkt door bedrijven De technologie is wel samengekomen in 1 bedrijf Investeringen waren grotendeels in dezelfde talen Minder goede afdekking van talen Waarom wel Nederlands? Oa De spraaktechnologie van Nuance Gedeeltelijk Vlaamse oorsprong (L&H) Gedeeltelijk Nederlandse oorsprong (Philips) 16

Spraaktechnologie Volledige taalafdekking kan niet van 1 bedrijf komen Ondanks moderne methodes van datacollectie via de cloud (Bijv. Nuance mobiel dicteren) Additionele bronnen zijn nodig 17

Overzicht META-NET Studie Het Nederlands in de META-NET studie Het Nederlands in Nuance Spraaktechnologie De ontwikkeling van spraaktechnologie Conclusies 18

De ontwikkeling van Spraaktechnologie De gebruikte technologie Voor het eerst toegepast in de jaren 70 Is goed en biedt nog steeds mogelijkheden tot vooruitgang in performantie Wordt tegenwoordig ook voor automatisch vertalen gebruikt Maar de vooruitgang is incrementeel / evolutionair; vooral gedreven door Meer data Meer rekenkracht (op PCs, in de cloud) Volgens velen zijn er inherente beperkingen aan de technologie Nieuwe paradigma s moeten onderzocht worden Dat kan alleen indien er ruimte is voor nieuwe onderzoeksprogramma s 19

Conclusies Er moet een gezamenlijk inspanning komen om de meertaligheid van Europa ook in het digitale tijdperk te behouden Voor het Nederlands moeten de eerder ingezette programma s nu een vervolg krijgen (anders kan het Nederlands ook in gevaar komen) De technologie moet verder verbeteren niet alleen incrementeel maar ook naar een hoger niveau getild worden De META-NET Strategische Agenda en de geformuleerde plannen voor Nederland en Vlaanderen vormen een goede basis voor onderzoeksprogramma s die dit concreet kunnen realiseren 20

META-NET SRA 21