Inhoudsopgave. Inleiding Overzicht van de hoofdstukken... 4

Maat: px
Weergave met pagina beginnen:

Download "Inhoudsopgave. Inleiding Overzicht van de hoofdstukken... 4"

Transcriptie

1 Inhoudsopgave Inleiding... 2 Overzicht van de hoofdstukken Lezen, voorlezen, mens en computer Het leerproces van mensen Hoe mensen kunnen lezen en voorlezen Computers en voorlezen Overeenkomsten en verschillen Klemtoon en Lettergrepen Klemtoon De Lettergreepstructuur De Voorleesmachine De Onderdelen De Lettergrepenvoorspeller De klemtoonvoorspeller op zinsniveau Grafeem naar foneem conversie Het mbrola programma Het programma De onderdelen De resultaten Conclusie De essentie van het onderzoek De probleemstelling Literatuurlijst Bijlagen Pagina 1

2 Inleiding Een interessant onderdeel van de informatica is de kunstmatige intelligentie. De vraag die hierbij past is: In hoeverre kan een computer de menselijke intelligentie nabootsen?. Het antwoord op deze vraag zal jaar na jaar wel verschillen omdat computers steeds krachtiger worden en de menselijke kennis van zowel de hersenen als computers toeneemt. Reeds bekend is dat de menselijke hersenen een groot aantal taken verrichten. Naast onder andere denken, rekenen en verbanden leggen kunnen mensen leren lezen. Een mens kan lezen om iets te leren, te begrijpen. Bovendien kan een mens ook kennis die op schrift is vastgelegd over brengen op andere mensen door het voor te lezen. Deze scriptie is gewijd aan deze betreffende functie van de menselijke hersenen. Mensen kunnen pas voorlezen als ze hebben geleerd te lezen. Het proces van het leren lezen door mensen begint op de basisschool waar kinderen letters en de bijbehorende klanken leren. Voordat ze naar de basisschool gaan hebben ze al veel woordjes en de bijbehorende betekenis geleerd. Op school leren ze hoe ze met behulp van letters deze woordjes kunnen samenstellen. Na het samenstellen van de woordjes wordt kinderen geleerd waar lettergrepen zich binnen deze woordjes bevinden. Met behulp van deze lettergrepen kan de reeds eerder geleerde kennis van klemtoon worden toegepast op de uitspraak. Voor het lezen en dus voorlezen gebruiken mensen hun hersenen. De dingen die op de basisschool zijn geleerd worden opgeslagen en toegepast in de praktijk. Hierdoor zijn mensen in staat teksten begrijpelijk voor te lezen aan andere mensen. Een computer bevat geen hersenen. Alles wat een computer kan zal eerst door mensen moeten worden geprogrammeerd. Een computer kan echter op verschillende manieren worden geprogrammeerd. Voor het maken van een voorleesmachine, een computer die teksten kan voorlezen op een manier zoals mensen dat doen, zijn reeds verschillende programma s geschreven. Bij het onderzoek naar deze programma s is duidelijk geworden dat er nog geen afgerond geheel is. De programma s zijn slecht stukjes van de puzzel die nog gelegd moeten worden. In deze scriptie is ook een stukje van de puzzel onderzocht met die aantekening dat de gehele puzzel niet uit het oog verloren is. Het gedeelte betreft het toekennen van klemtoon aan woorden. Voor dit onderdeel van de voorleesmachine is een programma geschreven. Daarnaast is er met betrekking tot het geheel een mogelijk ontwerp gemaakt. Het ontwerp is gebaseerd op de elementen die kinderen worden geleerd. In de scriptie zal de volgende probleemstelling worden behandeld: - In hoeverre is het mogelijk de gebruikte methode voor het automatisch toekennen van klemtoon aan woorden, in te passen in het gehele proces dat een computer moet doorlopen bij het voorlezen van gehele teksten? Pagina 2

3 Daarnaast komen er nog een tweetal vragen aan bod: Algemene vraag: - Kan een computer het leerproces van de mens evenaren als het gaat om het voorlezen van gehele teksten? Daarbij rekening houdend met grafeem-naar-foneem conversie, lettergrepen, prosodie en stresstoekenning. Deelvraag: - Leidt de gebruikte methode voor het toekennen van klemtoon aan woorden tot een bevredigend resultaat? De benodigde gegevens zijn in beperkte mate verkregen via literatuur over het leerproces van mensen van het lezen. Daarnaast is literatuur geraadpleegd over bestaande tekst-naar-spraak theorieën en modellen. Deze literatuur is te splitsen in twee onderdelen, statistische taalverwerking door computers en kunstmatige intelligentie. Ook is er gekeken naar bestaande programma s. Deze programma s betreffen de onderdelen van het gehele concept, zoals nader omschreven is in hoofdstuk drie. Tot slot is er een programmeeropdracht voltooid. De resultaten en bevindingen hiervan zijn de laatste gegevens. De theorieën zijn nauwkeurig omschreven in de volgende twee hoofdstukken. Het betreft hier theorieën die betrekking hebben op het leerproces van lezen en voorlezen door mensen, theorieën die zijn bedacht om computers geschreven taal te laten uitspreken en theorieën over het bepalen van klemtoon binnen woorden. De doelstelling van het onderzoek en de scriptie bevat twee elementen waarvan de een theoretisch en de ander praktisch is. Het theoretisch kader behelst een mogelijkheid te geven voor ontwikkeling van een voorleesmachine. Hiervoor is van belang te weten dat er tot nu toe programma s zijn geschreven die een directe grafeem-naar-foneem conversie bevatten. Nadat kinderen letters leren lezen ontwikkelen ze zich verder in het proces van lezen. Deze ontwikkeling is onderzocht en met de gegevens ervan is gekeken in hoeverre een computer deze ontwikkelingen kan overnemen. Het praktisch gedeelte bestaat uit de implementatie van een programma voor het voorspellen van klemtoon binnen woorden door een computer. In dit gedeelte zijn theoretische elementen uit voorgaande hoofdstukken overgenomen indien ze tot verbetering leidden. Daarnaast zijn de elementen die het resultaat negatief beïnvloedden getest en van het mogelijke commentaar voorzien. Pagina 3

4 Overzicht van de hoofdstukken Klemtoonvoorspelling op woordniveau Deze scriptie betreft een onderzoek naar het maken van een voorleesmachine. Gedurende het onderzoek is echter gebleken dat dit te omvangrijk was. Er is daarom besloten om het geheel van de benodigde elementen van een voorleesmachine op te splitsen om te zien welk element een interessant onderwerp zou zijn. Het onderwerp dat is gekozen is het automatisch bepalen van de klemtoon binnen woorden. Voor dit onderwerp is een programma ontwikkeld. De andere noodzakelijke elementen worden wel besproken en er is eventueel een aanzet tot een programma gegeven. Hoofdstuk 1 is een analyse van het leerproces van het lezen door mensen, de tot nu toe uitgevonden methodes van het voorlezen door computers en de overeenkomsten en verschillen tussen mens en computer. De bedoeling van dit hoofdstuk is een beeld te schetsen van de mogelijkheden voor het maken van een voorleesmachine die de mens zo dicht mogelijk benadert. Hoofdstuk 2 is een uiteenzetting van de bestaande theorieën met betrekking tot klemtoon. Ook wordt in het tweede hoofdstuk het onderwerp lettergreep behandeld. Gedurende het onderzoek werd namelijk duidelijk hoe belangrijk dit onderwerp is voor toekenning van klemtoon. In dit hoofdstuk wordt beschreven in hoeverre het toekennen van klemtoon aan woorden in regels te vangen is. Daarmee wordt bedoeld in hoeverre algoritmisch kan worden bepaald waar een klemtoon zich binnen een woord bevindt. Hoofdstuk 3 beschrijft uit welke onderdelen een voorleesmachine bestaat. Hierbij is voor elk onderdeel aangegeven wat de functie is. Dit hoofdstuk geeft een beeld van de opbouw van een voorleesmachine om aan te geven welk deel is behandeld en welke fenomenen in andere delen van het programma moeten worden opgelost. Hoofdstuk 4 beschrijft het gemaakte programma van het toekennen van klemtoon op woordniveau. Hierbij wordt uiteengezet wat de ondervonden problemen zijn en de veranderingen die zijn doorgevoerd. De techniek die is toegepast wordt beschreven en er wordt aangegeven van welke data gebruik is gemaakt. Daarnaast is er een vergelijking gemaakt met bestaande programma s aan de hand van resultaten en bevindingen. Het doel van dit hoofdstuk is te bekijken in hoeverre het gelukt is een goed programma te ontwikkelen. Hoofdstuk 5 geeft aan de hand van voorgaande hoofdstukken een samenvatting weer. Deze samenvatting is een aanloop voor het beantwoorden van de probleemstelling en andere vragen. Het geheel van het hoofdstuk is dus de conclusie die te vormen is aan de hand van het onderzoek. Pagina 4

5 1. Lezen, voorlezen, mens en computer In dit hoofdstuk wordt het leerproces van het lezen door mensen beschreven. Vervolgens wordt aangegeven hoe mensen kunnen lezen. Ook wordt er een overzicht gegeven van bestaande methodes voor het verwerken van tekst door computers. Deze elementen geven een duidelijk verschil aan tussen mens en computer, hetgeen vervolgens verder wordt uitgewerkt. 1.1 Het leerproces van mensen De eerste mens, de Homo erectus, vindt zijn oorsprong in Afrika. Het is onduidelijk of zij gearticuleerd konden spreken. Door verdere evolutie en daarmee samenhangende inventies zijn in de loop van de tijd meerdere taalgroepen ontstaan. 1 Hierbij is van belang voor deze scriptie dat de mens blijkbaar een behoefte voelde om te gaan communiceren. De uitvinding van het alfabet heeft er toe geleid dat de mens dit ook schriftelijk kon doen. Hiervoor was het van belang dat men leerde schrijven èn lezen. Aangezien men niet precies weet hoe taal is ontstaan en hoe de bijbehorende communicatievormen zich hebben ontwikkeld, is er in deze scriptie gekeken hoe kinderen zich ontwikkelen. Hiervoor waren wel voldoende gegevens beschikbaar. Een normaal kind kan heel snel taal oppikken. Een voorwaarde hiervoor is dat het zich in een omgeving bevindt waarin gesproken wordt. Hij of zij zal als eerste woorden na gaan spreken. Kenmerkend is dat het kind een aantal prosodische fases doorloopt. 2 In de eerste fase spreekt het kind monosyllabische woordjes. Opmerkelijk is dat dit vaak de lettergrepen van een woord zijn waar de klemtoon op valt. In de volgende fases leert het meerdere lettergrepen en een goede toekenning van klemtoon. De importantie van de omgevingsfactoren is voor het eerst onderzocht in de voormalige Sovjetunie. Hierbij werd voortgebouwd op de reflextheorie van Pavlov 3 en geconcludeerd dat alle mentale processen beschouwd kunnen worden als complexe functionele formaties, die opgebouwd zijn ten gevolge van concrete vormen van interactie tussen het organisme en zijn omgeving 4. Dit wil zeggen dat een kind leert op basis van vergelijking. Het vergelijkt zijn of haar eigen uitspraak met de opgevangen woorden uit de omgeving. Als het kind drie a vier jaar is heeft het al een hoop geleerd en kan het redelijk communiceren. In Nederland gaan kinderen dan naar een kleuterschool, waar het communicatieproces wordt bevorderd. Spelenderwijs leren kinderen omgang met andere kinderen. Lezen leren ze op de basisschool. Het belangrijkste aspect dat ze zich eigen moeten maken is de omzetting van een letter naar een klank. Daarnaast leren ze bijvoorbeeld met klapspelletjes waar de lettergrepen zich binnen een woord bevinden. In hoofdstuk twee zal duidelijk worden hoe belangrijk dit is. 1 F.G.Naerebout en H.W.Singor, De Oudheid (Amsterdam en Voorschoten 1995) 2 Fikkert en Penner, Zes stadia in het leren uitspraak in: Beers en Peters e.d, Phonological Developments (Brussel 1999) 3 Ivan Petrovitsj Pavlov ( ), fysioloog en nobelprijswinnaar, vermaard om zijn studies waarin hij aantoonde dat reflexen kunnen worden aangeleerd, oftewel geconditioneerd. 4 A.W. Burger, De betekenis van de leer van I.P. Pavlov voor de hedendaagse Sowjet-paedagogiek en kinderpsychologie (Groningen 1955) Pagina 5

6 Eerst lezen kinderen letter voor letter. Daarna gaan ze over tot het lezen van lettergreep na lettergreep. Als ze meer ervaren zijn gaan ze over tot het lezen van grotere orthografische eenheden, zoals bijvoorbeeld woord na woord. 5 Bij het lezen wordt er onbewust een vergelijking gemaakt met de geleerde uitspraak van woorden. Zodoende kan tijdens het lezen de klemtoon worden toegekend. De woordenschat en daarbij horende uitspraak wordt groter naarmate het kind ouder wordt. Dit betekent niet dat een kind alleen maar woorden goed kan uitspreken op basis van deze woordenschat. Een kind leert de uitspraak ook op basis van regels, dit is vast te stellen door kinderen onzinwoordjes te laten voorlezen. Een kind zal op basis van opgedane kennis deze woordjes op een bepaalde manier voorlezen Hoe mensen kunnen lezen en voorlezen Het proces van het lezen begint met het zien. Een beeld van een letter wordt opgevangen door de pupil binnen het oog. Dit beeld wordt omgekeerd geprojecteerd op het netvlies. Het netvlies bestaat uit twee soorten receptoren; kegeltjes voor de verwerking van kleur en detail, en staafjes voor de licht-donker verschillen. De verkregen informatie wordt door de receptoren doorgegeven aan neuronen binnen de hersenen. Uiteindelijk wordt de informatie verwerkt in de primaire visuele cortex die zich in de achterhersenen bevindt. Nadat beelden van letters zijn verkregen begint het tweede proces, het denken. Studie naar mensen met leesproblemen heeft opgeleverd dat er zeker twee gebieden in de linker hersenhelft met taalverwerking te maken hebben. De eerste is het gebied van Broca. 7 Beschadiging hieraan leidt tot problemen met de uitspraak. Er is echter wel taalbegrip. Een beschadiging aan het tweede gebied, dat van Wernicke 8, heeft tot gevolg dat mensen moeite hebben de taal te begrijpen en de juiste woorden niet kunnen vinden. Aldus is geconcludeerd dat het gebied van Broca zorgt voor de grammaticale en semantische structuur en het gebied van Wernicke ervoor zorgt dat woorden worden gerelateerd aan de in het geheugen opgeslagen beelden. 9 Bij het voorlezen komen er nog twee aspecten bij, spraak en gehoor. Hierbij is geluid een belangrijke factor. Geluid bestaat uit trillingsgolven. Deze golven zijn te meten in amplitude en frequentie. De amplitude is de intensiteit van een trilling, de frequentie is het aantal trillingen per seconde gemeten in hertz. Twee verwante elementen zijn geluidssterkte en toonhoogte. Geluidssterkte is de perceptie van de amplitude en het aantal trillingen per seconde bepaald de hoogte van een toon, des te meer trillingen, des te hoger de toon. 10 Geluidsgolven kunnen worden verwerkt in het menselijk oor. Binnen het slakkenhuis, een van de elementen van het oor, wordt aan de hand van de geluidsgolven de toonhoogte bepaald. Deze toonhoogte wordt via zenuwcellen doorgegeven aan de auditore cortex die de informatie verwerkt. Mensen spreken met behulp van hun tong. Aan uitgestoten lucht wordt zo een trilling meegegeven. Datgene wat gesproken wordt is afhankelijk van input zoals bijvoorbeeld beelden die mensen zien. In het geval van het voorlezen de gelezen woorden. De 5 W.M.J. Wentink, From graphemes to syllables (Wageningen 1997) 6 W.M.J. Wentink, From graphemes to syllables (Wageningen 1997) 7 Paul Broca ( ), Frans chirurg en antro(bio)loog, naar hem is het motorisch spraakcentrum in de hersenen genoemd. 8 Carl Wernicke ( ), Duits neuroloog-psychiater en neuropatholoog, maakte naam door zijn studie over sensorische afasie. 9 J.W. Kalat, Biological Psychology (4 e druk; Pacific Grove 1992) 10 J.W. Kalat, Biological Psychology Pagina 6

7 mogelijkheid om het woord uit te spreken is afhankelijk van het linker gedeelte van de cerebrale cortex. 1.3 Computers en voorlezen Een omzetting van tekst naar gesproken taal door de computer wordt een text-to-speech systeem genoemd. Het uiteindelijke doel van het systeem is om elke willekeurige tekst voor te kunnen lezen. Deze tekst kan worden ingevoerd via het toetsenbord of via een scanner. Het streven is om de uitspraak van de computer zo natuurlijk mogelijk te laten klinken. Kortom een text-to-speech systeem valt als volgt te definiëren: de productie van gesproken taal door machines door middel van automatische fonetisering van zinnen aan de hand van andere zinnen. 11 Dit houdt in dat de computer reeds naar fonetische tekens omgezette zinnen gebruikt voor het voorspellen van niet omgezette zinnen. Een beproefde methode die wordt gehanteerd bij text-to-speech systemen is de grafeem-naarfoneem conversie. Hierbij worden letters omgezet naar hun bijbehorende fonetische symbolen. Er zijn programma s ontwikkeld die deze symbolen kunnen omzetten naar de goede klanken en deze via de geluidskaart kunnen weergeven. Een voorbeeld van zo n programma is de Mbrola module die in hoofdstuk 3 wordt omschreven. Er zijn twee strategieën mogelijk met betrekking tot de omzetting van grafemen naar fonemen, een woordenboekgebaseerde strategie en een regelgebaseerde strategie. 12 De eerste strategie behelst een grote database van woorden met de bijbehorende fonetische omzetting. De computer zoekt nu voor elk woord uit de om te zetten tekst uit de database de goede omzetting. Een voorbeeld van zo n database is het Celex dat uit circa woorden bestaat. Een nadeel van deze methode is dat het onmogelijk is om alle Nederlandse woorden op te slaan in een database. Bij het verwerken van een tekst zal de computer dus altijd wel woorden tegen komen die niet in de database staan. De tweede strategie heeft geen moeilijkheden met dit probleem maar is moeilijker te ontwikkelen. De computer zet nu woorden om aan de hand van regels. Deze regels kunnen op twee manieren worden verkregen. Ten eerste kunnen zogenoemde expert-regels worden geïmplementeerd. Dit zijn regels opgesteld door taalkundigen. Ten tweede kunnen computers ook getraind worden aan de hand van een trainingscorpus. De computer leert nu zelf de regels op te stellen. Ook voor het trainen van een computer zijn weer verschillende methodes ontwikkeld. Voorbeelden zijn onder andere een Hidden Markov Model en een neuraal netwerk. De eerste is een zogenoemde reguliere automaat 13 met toestanden. Een toestand kan bijvoorbeeld de letter a zijn. Als nu bijvoorbeeld een tweede toestand het foneem A is dan wordt aan de hand van het doorlopen van woorden de kanswaarde van a naar A veranderd. Doordat dit voor elke letter kan worden gedaan waarbij wel van belang is dat er naar de hele letterreeks binnen een woord wordt gekeken, houdt de computer kanswaardes over. Met een andere tekst kan nu een omzetting plaatsvinden. In hoofdstuk vier wordt aan de hand van een voorbeeld een uitgebreide uitleg van het Hidden Markov Model gegeven. Een neuraal netwerk is een model van de menselijke hersenen. Het bestaat uit receptoren in een aantal lagen. De 11 T. Dutoit, An introduction to text-to-speech synthesis (Dordrecht 1997) 12 G.Bouma, Computationele Taalkunde en Taaltechnologie (Groningen 1998) 13 Een reguliere automaat is een object dat bestaat uit een aantal toestanden en verbindingen tussen die toestanden. Pagina 7

8 receptoren worden gedurende een proces wiskundig aangepast opdat de computer de juiste output genereert. Resumerend kan worden vastgesteld dat de computer letters om kan zetten in bijbehorende fonetische karakters. In deze scriptie is deze aanname aanwezig. Nu volgt echter de volgende stap. Tot nu toe zal de computer een monotone spraak zonder prosodie opleveren. Deze prosodie is echter wel van belang om het niveau van de mens te evenaren. 1.4 Overeenkomsten en verschillen Het belangrijkste verschil tussen mens en computer is begrip. Een computer leeft niet in een wereld waarin het iets met de gelezen informatie kan. Deze informatie is ook nietszeggend voor de machine. De computer heeft in zijn geheugen niet zoiets als een gebied van Wernicke. Alles wat een computer kan zal eerst door mensen moeten worden geprogrammeerd. Dit geldt ook voor de methodes om een computer te trainen. Deze trainingsmethodes zijn onderdeel van een specifiek terrein binnen de informatica, kunstmatige intelligentie genoemd. De definitie van kunstmatige intelligentie valt uiteen in vier gedeeltes: het denken als mensen, het handelen als mensen, rationeel denken en rationeel handelen door computersystemen. 14 Het gaat er hierbij om in hoeverre een computersysteem deze aspecten kan benaderen. Benaderen en evenaren zijn echter twee begrippen die behoorlijk ver uit elkaar kunnen liggen. Een kind traint en ontwikkeld zijn eigen hersenen. Dit wordt bevorderd door zijn omgeving. Het duurt een kind ongeveer drie tot vier jaar voordat het woordjes goed kan uitspreken. Hier ligt ook een belangrijk verschil. Computers worden niet drie jaar lang aan een omgeving blootgesteld waaruit ze informatie halen, opslaan en waar ze van leren. Voor het lezen van teksten is duidelijk begrip nodig. Dit heeft de computer nog niet en dus is de conclusie dat een computer voorlopig nog niet kan lezen. Er zijn echter wel overeenkomsten tussen mens en computer. Hiervoor moeten we een duidelijke scheiding maken tussen lezen en voorlezen. Indien een mens een verhaal voorleest zal hij of zij zelf het verhaal ook meekrijgen en snappen. Dit is echter niet noodzakelijk. Hier ligt de scheiding tussen de twee genoemde hersengebieden. Mensen met een storing aan het gebied van Wernicke zijn prima in staat om een tekst voor te lezen, ze kunnen echter niet de bijbehorende beelden in het geheugen erbij zien. 15 De uitdaging ligt nu in het feit een goed text-to-speech systeem te ontwikkelen voor de computer. Dit zal voor dit onderdeel in feite een kopie zijn van het menselijke gebied van Broca. 14 S.J. Russel en P. Norvig, Artificial Intelligence (Upper Saddle River 1995). 15 Ibidem, 8 Pagina 8

9 2. Klemtoon en Lettergrepen In dit hoofdstuk worden bestaande theorieën met betrekking tot klemtoon uiteengezet. Uitgelegd wordt wat klemtoon is en in hoeverre klemtoon in het Nederlands een rol speelt. Hierbij wordt een vergelijking gemaakt met het Engels, waar het onderzoek naar regelgeving voor het voorspellen van klemtoon zijn oorsprong heeft. Paragraaf 2.2 beschrijft de rechtvaardiging voor een opdeling in lettergrepen met betrekking tot het voorspellen van klemtoon binnen woorden. 2.1 Klemtoon Klemtoon behoort al zestig jaar lang tot de meest vooraanstaande internationale onderzoeksgebieden. Ter verduidelijking het betreft hier klemtoon op zin- en woordniveau. Andere woorden die in het dagelijks taalgebruik hiervoor gelden zijn o.a. nadruk, accent en stress. Wat maakt deze klemtoon nu zo interessant? Zoals in hoofdstuk 1 uiteen is gezet wordt de bepaling van de klemtoon door mensen reeds op jonge leeftijd aangeleerd. Wetenschappers hebben zich bezig gehouden met de vraag of de klemtoonbepaling ook in regels te vangen is. Met andere woorden is er enige logica met betrekking tot woordstructuur en de ligging van de klemtoon binnen dat woord? Mensen die zich hiermee bezig hebben gehouden zijn bijvoorbeeld Hyman, Chomsky en Halle. 16 Voordat er wordt overgegaan op de door deze wetenschappers ontdekte theorieën de meest essentiële vragen: 1. Wat is klemtoon? 2. Waarom hebben talen klemtoon? In het boek Klemtoon en metrische fonologie" geven Mieke Trommelen en Wim Zonneveld de volgende antwoorden: - Karakteristiek voor klemtoon is dat binnen een bepaald domein een lettergreep prominenter is dan alle andere lettergrepen. Dit is de culminatieve eigenschap van klemtoon. Er zijn verschillen tussen talen aanwezig, zo zijn er de free-stress languages en de fixed stress languages. Het verschil tussen beide is dat fixed klemtoon talen een vaste plek voor de klemtoon hebben. Zo valt in het Hongaars de klemtoon altijd op de eerste lettergreep. Het Nederlands is een free stress language omdat er geen onafhankelijke fonologische of andere grammaticale reden is waarom klemtoon binnen woorden op verschillende lettergrepen kan liggen. Dit wil zeggen dat klemtoon in het Nederlands gedeeltelijk vrij is. De belangrijkste factoren die een rol spelen bij klemtoon zijn toonhoogte en duur. Zo geeft klemtoon de luisteraar informatie, onder meer om lettergrepen te onderscheiden. Naast de hiervoor genoemde klemtoon-accent talen zijn er ook de zogenaamde toon-talen. De aard van toontalen houdt in dat bijvoorbeeld monosyllabische woorden kunnen verschillen in hun toon en daarmee in hun betekenis. Hiernaast bestaan er ook nog pitch-talen, zij hebben met toontalen de tooncontouren 16 Taalkundigen waarvan Avram Noam Chomsky het bekendst is, hij was de grondlegger van de descriptieve en theoretische taalwetenschap. Dit o.a. vanwege zijn formalisering van grammatische beschrijvingen. Pagina 9

10 gemeen en met klemtoontalen dat een toonhoogte sprong maar eens per woord kan voorkomen. 17 Samengevat maken de auteurs een onderscheid tussen talen en de functie van klemtoon binnen die talen. Klemtoon is een kenmerk van een taal. Mensen die zich een bepaalde taal eigen hebben gemaakt, maken bewust of onbewust gebruik van de eigenschappen van de klemtoon binnen deze taal, zowel op het vlak van spreker als luisteraar. Aangezien deze scriptie zich bezig houdt met het laten voorlezen in het Nederlands door een computer, is het onontkoombaar dat een computer klemtoon zal moeten kunnen toekennen aan zowel woorden als zinnen om zich goed verstaanbaar te maken. Hier bevindt zich dus ook het onderzoeksgebied. Het belang richt zich met name tot de correcte toekenning van klemtoon op een lettergreep binnen een woord. Dit is juist zo interessant omdat het Nederlands een free-stress language is. Voor het programmeeronderdeel is gekeken naar de mogelijkheid om de computer te trainen in het toekennen van klemtoon. Onderzoek van taalkundigen naar klemtoon heeft gelukkig al belangrijke resultaten opgeleverd. Ook met deze resultaten is verder gewerkt. De historische basis van onderzoek naar klemtoon is gelegd door Chomsky en Halle in The Sound Pattern of English. 18 Het belangrijkste resultaat dat zij verkregen was de zogenoemde Main Stress Rule. Aan de hand van deze regel konden zij voor een groot gedeelte de goede plek van klemtoon binnen een woord bepalen voor het Engels. Een verrassend bijkomend resultaat was de overeenkomst qua vorm met het Klassiek Latijn. De main stress rule werkt op het principe van zwakke clusters. Een zwak cluster is een enkele korte klinker of een korte klinker gevolgd door maximaal één medeklinker. main stress rule: - De klemtoon valt het eerste niet-zwakke cluster van rechts, indien er geen sterk cluster is valt de klemtoon op de derde klinker van rechts. Indien een woord maar twee lettergrepen heeft en geen sterke clusters valt de klemtoon op de meest linkse klinker. De wijzigingen en uitzonderingen worden hierbij buiten beschouwing gelaten. Deze zijn verder ook niet van belang in het kader van verder onderzoek. Wat wel van belang is dat Nederlandse onderzoekers, zoals Evers en Huybregts, zich bezig hebben gehouden met de vraag in hoeverre de main stress rule voor het Nederlands geldt. Het resultaat zoals beschreven in Klemtoon en Metrische fonologie bestaat uit zowel overeenkomsten als verschillen. Zo heeft het Nederlands bijvoorbeeld veel meer eindklemtoon. Als zeer bruikbaar geldt de afsluiting van het tweede hoofdstuk waarin de overeenkomsten en verschillen tussen Nederlandse onderzoekers op een rijtje zijn gezet. Van belang zijn de overeenkomsten: - twee clusters krijgen in woordfinale positie klemtoon: 1. een lange klinker gevolgd door een of meer medeklinkers (advocaat) 2. een korte klinker gevolgd door twee of meer medeklinkers (ledikant) - schwa, zoals het foneem wordt genoemd dat bij de e hoort van vader krijgt nooit klemtoon - bij een finale lange klinker is, in het regelmatige geval, klemtoon niet-finaal (Amerika) 17 M. Trommelen en W. Zonneveld, Klemtoon en metrische fonologie (Muiderberg 1989) 18 N. Chomsky en M. Halle, The sound Pattern of English (New York 1968) Pagina 10

11 De hiervoor genoemde ontdekkingen zijn onvoldoende om in het algemeen de positie van klemtoon te bepalen. Het zijn slechts onderzoeksresultaten en worden het lineaire karakter van klemtoon genoemd omdat ze geen analyse zijn van diepe woordstructuren maar van verbanden tussen een klinker en de daarbij horende uitspraak. Doordat er nogal wat nadelen aan deze aanpak zitten, is er verder onderzoek gedaan. Dit heeft geleid tot een metrische aanpak van klemtoon. Voor het Engels zijn de belangrijkste namen die hierbij horen Liberman en Prince. 19 Zij zijn hier toe gekomen aan de hand van samenstellingen. Een analyse van samenstellingen heeft tot de ontdekking van binaire boomstructuren geleidt. Binnen een samenstelling krijgt een van de woorden de meeste nadruk. Dit is het makkelijkst uit te leggen aan de hand van een voorbeeld. Van de samenstelling radio station manager is de volgende boom te maken (figuur 1): Figuur 1: /\ figuur 2: /\ s \ s \ / \ \ / \ \ s w w s w w radio station manager ci ne ma Hierbij geldt de structuur: s = strong, w = weak, en bij een vertakking in de boom kan het rechter gedeelte alleen s zijn indien deze nog verder vertakt. De klemtoon valt nu op het woord radio. De s houdt in dat de vertakking in dit betreffende woord prominenter is dan het binair ander vertakt gedeelte. Om het helemaal duidelijk te maken de volgende structuur: [[radio station] manager] waarbij radio iets van station zegt en dus sterker is, en radio station iets van manager zegt en dus sterker is. Wat men vervolgens heeft ontdekt is het feit dat deze structuren ook voor ongelede woorden gelden. Een woord is immers op te delen in lettergrepen, waarbij geldt dat er uiteindelijk maar een meest prominente lettergreep is (figuur 2). De opdeling van een ongeleed woord geschiedt op basis van de sterkte van een lettergreep. In het voorbeeld is ci de sterkste lettergreep en daarbij overheersend over ne en ma. Aldus is de structuur: [[ci ne] ma] te maken. Het Nederlands lijkt in veel opzichten op het Engels. Beide hebben veel invloed ondergaan van het Latijn. Daarnaast heeft het Nederlands veel leenwoorden overgenomen uit het Engels. 20 Neijt en Zonneveld hebben ontdekt dat de binaire bomen ook voor het Nederlands zijn te maken. In het volgende hoofdstuk zal duidelijk worden in hoeverre gebruik is gemaakt van de ontdekte theorieën. Hierbij is van belang te weten dat de Nederlandse taal uit veel uitzonderingen en leenwoorden van andere talen bestaat. 2.2 De Lettergreepstructuur In het volgende hoofdstuk wordt een mogelijke structuur voor een voorleesmachine weergegeven aan de hand van kennis over het leren lezen van mensen. Daarbij hoort de tweede fase het herkennen van lettergrepen. Voor het herkennen van klemtoon binnen woorden en zinnen is het niet noodzakelijk om woorden hierin op te delen. Deze aanpak is echter wel verkozen om drie redenen. De eerste reden is reeds genoemd. De aanpak is gebaseerd op het leerproces van mensen. Bij het voorlezen gebruiken kinderen de opdeling van lettergrepen voor een goede uitspraak van een woord. Ze doen dit om na te gaan welk 19 Liberman schreef o.a. The intonational system of English (New York 1979) 20 ibidem, 16. Pagina 11

12 gedeelte van een woord de meeste nadruk verkrijgt. De tweede reden is aan de eerste gekoppeld. Een mens legt immers korte stiltes tussen lettergrepen bij het uitspreken van een woord. De aansturing van het Mbrola programma gebruikt parameters als input om deze stiltes in een woord aan te brengen. De opdeling in lettergrepen maakt het mogelijk deze parameters te construeren. De derde reden houdt verband met de metrische aanpak van klemtoonvoorspelling. Bij deze aanpak wordt gekeken naar de sterkte van een lettergreep. Hiervoor is dus een opdeling in de lettergrepen noodzakelijk om tot een binaire boomstructuur en klemtoonvoorspelling te komen. Voor het implementeren van een programma dat lettergrepen kan herkennen is het noodzakelijk de kennis van de Nederlandse lettergreep te weten. Daarom een uitleg over de opbouw van een lettergreep. Een Nederlandse lettergreep bestaat uit drie gedeeltes, de onset, de nucleus en de coda. De onset is het eerste gedeelte van een lettergreep en bestaat uit nul of meer medeklinkers. De nucleus is het belangrijkste gedeelte van de lettergreep omdat het altijd aanwezig is. Het bestaat uit een of meer klinkers. Tenslotte is de coda het laatste gedeelte, het bevat net als de onset nul of meer medeklinkers. Bij het maken van het programma dat de lettergrepen herkent is ook een opdeling in deze drie onderdelen gemaakt. Daarnaast hebben alledrie de onderdelen maar beperkte mogelijkheden, zo kan een nucleus wel bestaan uit de klinkercombinatie aa of au maar niet uit ia, dit zijn per definitie twee lettergrepen. Een onset kan wel bestaan uit br of bl maar niet uit bk. Omdat voor het toekennen van klemtoon gebruik kan worden gemaakt van de boomstructuren is een nog een rechtvaardiging voor de opdeling in lettergrepen te geven. Van nietsamengestelde woorden is immers een boomstructuur te maken op basis van deze lettergrepen. Daarbij wordt gekeken naar de zwaarte van een lettergreep. Ten slotte nog een punt van rechtvaardiging. Bij het onderzoek van Hanneke Wentink naar de ontwikkeling van fonologische decodering bij slechte en normale lezers heeft zij geconcludeerd dat syllaben een functie hebben. Het stimuleren van syllabegebonden decodeervaardigheden leidt tot een snellere woordidentificatie bij mensen en aldus tot een beter tekstbegrip. 21 Aangezien de kunstmatige intelligentie zich behoorlijk aan het ontwikkelen is kan dit eventueel van belang zijn voor de toekomst om zodoende computers woorden ook echt te laten begrijpen en misschien een gebied van Wernicke te implementeren. 21 W.M.J. Wentink, From graphemes to syllables Pagina 12

13 3. De Voorleesmachine Dit hoofdstuk geeft een beeld van de opbouw van een voorleesmachine. Er wordt aangegeven uit welke elementen het bestaat en, indien noodzakelijk, hoe deze zijn ontwikkeld of kunnen worden ontwikkeld. Eerst volgt er een korte omschrijving van de onderdelen in de volgorde waarin ze voorkomen. Deze volgorde is gelijkgetrokken met de volgorde waarin mensen de elementen leren. Vervolgens worden de onderdelen uitgebreid behandeld. Hierbij wordt gekeken naar de moeilijkheden met betrekking tot het maken van een computerprogramma voor desbetreffend onderdeel. 3.1 De Onderdelen Tekst file Lettergrepen voorspeller Grafeem naar foneem conversie Klemtoon voorspeller Mbrola Geluids kaart Figuur 3. In figuur 3 staat aangegeven uit welke onderdelen een voorleesmachine bestaat en in welke volgorde er in het programmeeronderdeel gebruik van wordt gemaakt. Een kind leert op de basisschool eerst de letters omzetten naar klanken. De grafeem naar foneem conversie staat achter de lettergrepenvoorspeller omdat een kind gedurende het leerproces leert lettergreep na lettergreep te lezen. Hieronder volgt een beschrijving van de onderdelen: 1. Als eerste heeft de machine net als alle computerprogramma s input nodig. Deze input kan een willekeurige Nederlandse tekst zijn die is opgeslagen in een file. 2. Het tweede onderdeel van de voorleesmachine is de lettergrepenvoorspeller. Deze module deelt de inputfile op in lettergrepen door bijvoorbeeld streepjes te zetten tussen de lettergrepen. Bijvoorbeeld lettergreep naar let-ter-greep. 3. Het derde deel is het omzetten van letters naar de bijbehorende klanken. Zo wordt het woord let-ter-greep omgezet naar le-t@r-grep. 4. Het volgende gedeelte is verwerkt in de programmeeropdracht. Dit gedeelte bestaat uit het bepalen van de klemtoon binnen een woord. De moeilijkheid hierbij is dat het Nederlands een free-stress language is. Binnen een woord is er dus geen vaste plek of lettergreep waar de klemtoon zich bevindt. Dit onderdeel is uitgewerkt in het volgende hoofdstuk. Naast nadruk binnen woorden is er ook de nadruk binnen een hele zin die voor een goede uitspraak zal moeten worden voorspeld. 5. Voor het vijfde gedeelte, het aansturen van de geluidskaart met fonetische taal is gebruik gemaakt van het Mbrola programma. De aansturing van het programma dient te Pagina 13

14 geschieden door het maken van een input file. Deze file bestaat uit fonetische tekens met bijbehorende parameters. Deze parameters representeren respectievelijk de toonhoogte, de stiltes en de duratie van een toon. Met behulp van deze parameters kan dus worden aangegeven waar de nadruk moet komen op een woord of binnen een zin. Ook kan een scheiding tussen twee lettergrepen worden aangegeven met behulp van een stilte. Deze parameters kunnen worden gegenereerd in onderdeel twee en vier. De input van het woord lettergreep kan er zo uitzien: _ 125 : een stilte van 125 milliseconden. ;; T = 1.4 : de toonhoogte. l 100 : de lengte van de l. E : de lengte en toonhoogte van E en de stilte erna. ;; T = 1 : de toonhoogte. t 100 r 100 G 100 r 100 e 100 p 100 : de lengtes van de voorgaande letters _ 125 : en weer een stilte 3.2 De Lettergrepenvoorspeller Voor dit onderdeel van de voorleesmachine is een aanzet gegeven tot een programma, lg.pl genaamd. Dit programma leest uit een tekst woorden een voor een in en zet ze daarna om in woorden waarbij de lettergrepen zijn gescheiden door horizontale streepjes. De moeilijkheid bij het programmeren van het onderdeel is een bekend probleem: ambiguïteit. Dit valt in deze context het best uit te leggen aan de hand van een voorbeeld. Indien we een woord nemen als paardje dan is dit woord op te delen in twee lettergrepen, paard en je. Een zelfde soort woord namelijk paartje dient te worden opgedeeld als paar en tje. De moeilijkheid zit dus in het middenstuk en de computer zal moeten leren waar precies op te delen en geen paar en dje te construeren. In Computationele Taalkunde en Taaltechnologie geeft Bouma een viertal regels voor het opdelen van woorden in lettergrepen: 1. Samengestelde woorden worden zo gesplitst dat de samenstellende delen gescheiden kunnen worden: schaap-achtig, breek-ijzer. 2. De delen die resteren na regel 1 worden verdeeld in lettergrepen: ach-tig, ij-zer. 3. Bij het toepassen van regel 2 moeten er steeds zoveel mogelijk medeklinkers bij de volgende lettergreep worden gevoegd. (niet alf-a-bet maar al-fa-bet). 4. Er zijn enkele uitzonderingen.(beha-tje). Het programma is geschreven om het geheel van de voorleesmachine vorm te geven en de importantie ervan aan te tonen. Het programma lg.pl is geschreven in de programmeertaal Perl 22 en bestaat uit een aantal functies. Als eerste wordt de functie init() aangeroepen die de 22 Perl staat officieel voor: The Practical Extraction Report Language. Pagina 14

15 initialisatie van de variabelen verzorgt. Daarnaast is er de functie move(). Deze functie leest van een woord de eerstvolgende letter in een buffer variabele. Figuur 4, E mk mk mk mk kl-co mk mk mk eind Vervolgens zijn er drie functies, get_onset(), get_nucleus()en get_coda() deze bepalen, zoals de naam van de functies al zegt, de drie onderdelen van een lettergreep binnen een woord. Deze drie functies zijn opgebouwd aan de hand van de figuur 4. Deze reguliere automaat geeft aan welke mogelijke routes de computer kan volgen bij het bepalen van de lettergrepen. In de eerste toestand staat de letter E voor epsilon oftewel een lege toestand, dit omdat een lettergreep niet noodzakelijk een onset hoeft te bevatten. De andere toestanden bestaan uit een medeklinker (mk) of een klinker combinatie (kl-co). Op deze wijze wordt een woord geparsed en worden de lettergrepen eruit gehaald. Hierbij is de bottleneck van het programma een lijst met mogelijke nuclei en coda s. Het programma loopt door een woord en checkt aan de hand van de letters waar een opdeling moet volgen, hierbij is met een aantal uitzonderingen rekening gehouden, zoals onder andere het genoemde paartje, paardje probleem. De uitzonderingen worden verwerkt in de functie exceptions() en kunnen eventueel worden aangevuld. De source code staat vermeld in de bijlagen. 3.3 De klemtoonvoorspeller op zinsniveau Zinsklemtoon is van groot belang bij het voorlezen van teksten omdat de spreker extra aandacht voor bepaalde woorden kan trekken door deze woorden sterk te benadrukken. Bij het voorlezen maakt de mens gebruik van zijn geheugen waarin het de reeds gelezen woordjes opslaat, daarnaast heeft een mens zoveel taalkennis opgedaan, dat indien binnen een zin het woord bereikt wordt dat extra nadruk verkrijgt, dit herkend zal worden. Het probleem van de computer is deze kennis. De computer zal een zin moeten kunnen ontleden op een of andere wijze en daarnaast moet het de gelezen woorden kunnen onthouden en in verband brengen met het ontledingsproces. Ten slotte zal de computer rekening moeten houden met punctuatie omdat een vraagzin een heel andere intonatie heeft dan andere zinnen. Er zijn drie manieren ontwikkeld voor het syntactisch-prosodisch parsen van zinnen. Deze parsing houdt in dat zinnen worden opgedeeld in kleinere onderdelen die kunnen helpen bij het voorlezen en het bepalen van de klemtoon. De eerste methode omvat handverkregen heuristieken. In deze methode worden regels door taalkundigen opgesteld. Door deze regels in een computerprogramma op te nemen kunnen zinnen worden opgedeeld. Een voorbeeld is het chinks n chunks algoritme Liberman en Church (1992), een kleine prosodische zin = een reeks chinks gevolgd door een reeks chunks. Pagina 15

16 De volgende methode bestaat uit Grammatica gebaseerde systemen. Dit zijn uitbreidingen op de populaire context vrije grammatica van Chomsky. Ze zijn onder te verdelen in augmented transition networks (ATNs) (Woods, 1970), definite clause grammars (DCGs) (Pereira en Warren, 1980) en unification grammars (UGs). Ze bestaan uit een reeks van herschrijfregels waarbij de volgorde van belang is en aan de hand waarvan een zin kan worden ontleed. Deze herschrijfregels hebben de vorm van A! a en a! b. Nu kan aan de hand van deze twee regels een herschrijving plaatsvinden in A! b. Ter verduidelijking een simpel voorbeeld van een grammatica: zin(np, VP)! np(np,nummer), vp(vp,nummer). np(np,1)! ik np(np,2)! jij vp(vp,1)! slaap vp(vp,2)! slaapt Aan de hand van deze grammatica kunnen twee zinnen worden ontleed: Ik slaap en Jij Slaapt. Hierbij wordt de zin Ik slaap als volgt ontleed: Nummer = 1. Zin()! np(np, 1), vp(vp, 1) Zin ()! ik, slaap Zin(ik, slaap). Vervolgens zijn er nog de automatisch, corpus gebaseerde methodes. Deze methodes bestaan uit het parsen van een zin met behulp van binaire kansbomen aan de hand van CART 24 technieken. Deze technieken houden in dat er in een tekst met de hand aangegeven wordt waar een stilte valt of waar de klemtoon binnen een zin ligt. Aan de hand van deze tekst wordt een binaire boom opgesteld die waardes bevat van deze prosodische elementen. Met behulp van deze boom en een algoritme kunnen nu andere zinnen worden ontleed. Bijvoorbeeld van de zinnen ik ben moe en ik ben erg moe, waarbij de aangeeft waar de klemtoon zich bevindt kan de volgende binaire boom worden gemaakt: nee 1/2 nee Ja 2/2 1/1 nee ja nee 1/2 0/2 Hierbij worden de pijlen gelabeld met waardes. Aan de hand van deze waardes kan nu een voorspelling van een andere zin gedaan worden. De zin ik heb honger kan op twee manieren worden ontleed: 1. nee - nee 2/2 nee 1/ 2 en 2. nee - nee 2/2 ja 1/ 2 Hierbij valt de eerste methode af omdat in dit geval er geen klemtoon wordt toegekend. En ik heb enorme honger wordt dan respectievelijk: nee - nee 2/2 - nee 1/2 - ja 1/1. Dus ik heb enorme honger. Dit is slechts een heel simpel voorbeeld maar op deze manier kan diverse prosodische informatie worden gegenereerd. De in voorgaande alinea s genoemde manieren tot segmentatie van een zin in prosodische delen zorgen er allemaal voor dat de uitspraak van een zin minder monotoon oftewel robotachtig klinkt. Ze houden geen rekening met de relatie tussen woorden en andere context 24 Classification and regression tree (Brieman 1984, Bahl 1989, Withgott en Chen 1993) Pagina 16

17 verbanden. Dit is ook de grote moeilijkheid van het bouwen van een voorleesmachine. Het is moeilijk te voorspellen hoe de hersenen deze verbanden leggen. Ter conclusie: As can be seen, although prosody has been increasingly investigated these last years in the context of Text To Speech synthesis, there is still a long way from text to automatically derived natural prosody Grafeem naar foneem conversie Essentieel voor een text-to-speech systeem is de automatische omzetting van een woord naar de bijbehorende uitspraak. Een letter of een letterreeks binnen een woord wordt een grafeem genoemd, de bijbehorende uitspraak van een of meer letters foneem. Er zijn een aantal moeilijkheden bij het automatisch omzetten, zo kan één grafeem corresponderen met meerdere fonemen en kan één grafeem op verschillende manieren worden uitgesproken. Er zijn twee mogelijke oplossingen bedacht voor het omzetten, woordenboek gebaseerde methodes en regel gebaseerde methodes. De eerste bestaat uit het uitlezen van de bijbehorende fonetische omzetting van een woord uit een grote database. Tevens is er de tweede, meer ingewikkelde oplossing. De computer parsed nu een woord aan de hand van opgestelde regels. Deze regels kunnen worden opgesteld door taalkundigen, de expert regels gebaseerde methode, maar ook worden verkregen door trainingsmethodes. Een trainingsmethode bestaat uit het verwerken van een trainingscorpus aan de hand waarvan de computer zelf, met feedback van de programmeur, regels opstelt. Dit kan bijvoorbeeld aan de hand van het reeds genoemde Hidden Markov Model. 3.5 Het mbrola programma Het Mbrola programma is een spraaksynthesizer gemaakt door Thierry Dutoit en is gebaseerd op het concateneren van difonen. Dit wil zeggen dat twee opeenvolgende fonemen aan elkaar worden geplakt aan de hand waarvan de uitspraak wordt gegenereerd. Het heeft, zoals in paragraaf 3.1 vermeld staat, als input een lijst van fonemen tezamen met prosodische informatie bestaande uit de duratie van de fonemen en de beschrijving van de toonhoogte. De output bestaat uit 16 bits spraak samples. Het programma is voor een aantal talen geschreven, waaronder het Nederlands. Het uiteindelijke doel van het project was om academici te helpen met en aan te sporen tot het ontwerpen van tekst naar spraak systemen. Het is gemaakt om op veel systemen te draaien zoals oa. Unix en Windows. Het systeem genereert een.pho file waarin de waarden zijn toegekend aan fonemen strings die vervolgens worden omgezet in een.wav file. Dit is een audio file en kan worden beluisterd middels een geluidskaart en een programma dat wav files kan afspelen. 25 Ibidem, 10. Pagina 17

18 4. Het programma Dit hoofdstuk beschrijft het gemaakte programma van het toekennen van klemtoon op woordniveau. Eerst wordt beschreven hoe het programma is ontwikkeld. Deze ontwikkeling wordt beschreven aan de hand van de ondervonden problemen en de daarvoor gevonden oplossingen. Het programma is opgedeeld in drie onderdelen die respectievelijk worden besproken. Vervolgens worden de resultaten van het programma genoemd, deze resultaten worden gespiegeld aan resultaten die door een ander programma zijn verkregen. 4.1 De onderdelen trainingscorpus Mem_str.pl Hmm_maak.pl Vast geheugen hmm testcorpus Hmms.pl resultaat Mem_train.pl Nieuw hmm Hmm.pl Figuur 5. Trainings geheugen Hmm_train.pl In figuur 5 is met drie kleuren aangegeven uit welke onderdelen het programma bestaat. Het eerste gedeelte is in het blauw aangegeven. In dit gedeelte wordt de basis gelegd door aan de hand van het trainingscorpus een model te genereren. Ook bevat het eerste gedeelte het aanmaken van het vast geheugen. De groen gekleurde elementen beschrijven het tweede gedeelte namelijk het genereren van een resultaat, dit resultaat kan op twee manieren worden verkregen, met of zonder het vast geheugen. Tenslotte staat het derde deel, het trainingsmodel, in het rood weergegeven. De eerste twee gedeeltes zijn geprogrammeerd met behulp van statistische taalverwerking en het derde deel omvat kunstmatige intelligentie. Pagina 18

19 4.1.1 Het model Het weak cluster principle is uitgedacht door Chomsky en Halle. Het houdt in dat er binnen woorden sterke en zwakke lettergrepen kunnen zijn. Waarbij geldt dat een lettergreep zwak is, indien deze lettergreep bestaat uit: - 1 enkele korte klinker - 1 korte klinker gevolgd door maximaal 1 medeklinker. Aangezien er veel overlapping is tussen het Engels en het Nederlands, is dit als uitgangspunt genomen voor het automatisch toekennen van klemtoon. Voor een verder begrip van het programma is een uitgebreidere uitleg van het hidden markov model noodzakelijk. Een markov model bestaat uit een aantal toestanden en een aantal transities. In figuur 6 staat het hidden markov model weergegeven. Er zijn drie toestanden en acht transitiepijlen te zien. De toestanden zijn de rondjes met 0, 1 en 2. Hiervan is toestand 0 rood gekleurd omdat dit de begintoestand is. De transitiepijlen zijn gelabeld met weak of strong. Aan de hand van een bepaalde input kan een route worden gevolgd in het model. Stel dat voor het onderstaande model de input bestaat uit weak-weak-strong. Dan zijn er vier verschillende routes mogelijk namelijk: 0-0-0, 0-0-1, en figuur 6. Voor het programma is één element toegevoegd aan het model namelijk de volgende regel: Bij het aanmaken van het model kan een lettergreep zich alleen maar in toestand 1 bevinden indien deze lettergreep klemtoon heeft. Vanwege dit element is toestand 1 blauw gekleurd in de figuur. Een onderdeel van het eerste gedeelte van het programma, het Perl programma hmm_maak.pl, maakt het bovenstaande model en bepaald tevens de transitiewaarden. Dit gaat als volgt in zijn werk: Er is gebruik gemaakt van een trainingscorpus gehaald uit het Celex, waarin woorden reeds zijn omgezet naar fonetische tekens en waarin de positie van de klemtoon voor elk woord met een apostrophe is aangegeven. Dit corpus wordt woord voor woord in een variabele ingelezen. Vervolgens wordt het woord opgesplitst in lettergrepen (ook reeds met behulp van streepjes aangegeven in Celex). Het woord komt het hidden markov model binnen in toestand 0 met de eerste lettergreep. Nu wordt er gekeken middels een functie in hmm_maak.pl of de lettergreep zwak of sterk is en of de klemtoon zich op deze lettergreep bevindt. Deze functie is Check() genoemd en ziet er als volgt uit: Pagina 19

Het belangrijkste doel van de studie in hoofdstuk 3 was om onafhankelijke effecten van visuele preview en spellinguitspraak op het leren spellen van

Het belangrijkste doel van de studie in hoofdstuk 3 was om onafhankelijke effecten van visuele preview en spellinguitspraak op het leren spellen van Samenvatting Het is niet eenvoudig om te leren spellen. Om een woord te kunnen spellen moet een ingewikkeld proces worden doorlopen. Als een kind een bepaald woord nooit eerder gelezen of gespeld heeft,

Nadere informatie

Klanken 1. Tekst en spraak. Colleges en hoofdstukken. Dit college

Klanken 1. Tekst en spraak. Colleges en hoofdstukken. Dit college Tekst en spraak Klanken 1 Representatie van spraak vereist representaties van gedeeltes die kleiner dan woorden zijn. spraaksynthese (tekst-naar-spraak) rijtje letters! akoestische golfvorm http://www.fluency.nl/

Nadere informatie

Cover Page. The handle holds various files of this Leiden University dissertation.

Cover Page. The handle  holds various files of this Leiden University dissertation. Cover Page The handle http://hdl.handle.net/1887/44267 holds various files of this Leiden University dissertation. Author: Spierings, M.J. Title: The music of language : exploring grammar, prosody and

Nadere informatie

8. Afasie [1/2] Bedenk tenminste drie verschillende problemen die je met taal zou kunnen hebben (drie soorten afasie).

8. Afasie [1/2] Bedenk tenminste drie verschillende problemen die je met taal zou kunnen hebben (drie soorten afasie). 8. Afasie [1/] 1 Afasie De term afasie wordt gebruikt om problemen met taal te beschrijven die het gevolg zijn van een hersenbeschadiging. Meestal is de oorzaak van afasie een beroerte. Het woord afasie

Nadere informatie

Cover Page. Author: Scholz, Franziska Title: Tone sandhi, prosodic phrasing, and focus marking in Wenzhou Chinese Issue Date:

Cover Page. Author: Scholz, Franziska Title: Tone sandhi, prosodic phrasing, and focus marking in Wenzhou Chinese Issue Date: Cover Page The handle http://hdl.handle.net/1887/19983 holds various files of this Leiden University dissertation. Author: Scholz, Franziska Title: Tone sandhi, prosodic phrasing, and focus marking in

Nadere informatie

Tentamen Spraakherkenning en -synthese

Tentamen Spraakherkenning en -synthese Tentamen Spraakherkenning en -synthese Rob van Son 25 maart 2008 Vermeld op iedere pagina je naam, je studentnummer en het volgnummer per pagina. Gebruik voor elke opgave (1-5) een apart vel. Als je voor

Nadere informatie

Latijn en Grieks in de 21ste eeuw

Latijn en Grieks in de 21ste eeuw Latijn en Grieks in de 21ste eeuw Kiezen voor Latijn en/of Grieks? Als leerling in het laatste jaar van de basisschool sta jij voor een belangrijke keuze. Welke studierichting moet je gaan volgen in het

Nadere informatie

1e Deeltentamen Inleiding Taalkunde

1e Deeltentamen Inleiding Taalkunde 1e Deeltentamen Inleiding Taalkunde 28/05/2009 13.15-16.15 Dit tentamen heeft 5 vragen. Je hebt drie uur de tijd om deze te beantwoorden. Vergeet niet je naam en studentnummer steeds duidelijk te vermelden.

Nadere informatie

In Vlaanderen bestaat er nog geen leerlijn programmeren! Hierdoor baseren wij ons op de leerlijn die men in Nederland toepast voor basisscholen.

In Vlaanderen bestaat er nog geen leerlijn programmeren! Hierdoor baseren wij ons op de leerlijn die men in Nederland toepast voor basisscholen. Leerlijn programmeren In Vlaanderen bestaat er nog geen leerlijn programmeren! Hierdoor baseren wij ons op de leerlijn die men in Nederland toepast voor basisscholen. Deze leerlijn is opgebouwd aan de

Nadere informatie

How Do Children Read Words? A Focus on Reading Processes M. van den Boer

How Do Children Read Words? A Focus on Reading Processes M. van den Boer How Do Children Read Words? A Focus on Reading Processes M. van den Boer Samenvatting Leesvaardigheid is van groot belang in onze geletterde maatschappij. In veel wetenschappelijke studies zijn dan ook

Nadere informatie

Personiceren van stemmen met Deep Learning

Personiceren van stemmen met Deep Learning Personiceren van stemmen met Deep Learning Kan het Nationaal Archief straks teksten voorlezen met de stem van Joop den Uyl? Esther Judd-Klabbers 20 September 2016 Overzicht Introduction Statistische Parametrische

Nadere informatie

Natuurlijke-Taalverwerking I

Natuurlijke-Taalverwerking I 1 atuurlijke-taalverwerking I Gosse Bouma en Geert Kloosterman (pract) 2e semester 2005/2006 Overzicht Week1 : Inleiding, Context-vrije grammatica. Week 2-3 : Definite Clause Grammar Regels, gebruik van

Nadere informatie

a p p e n d i x Nederlandstalige samenvatting

a p p e n d i x Nederlandstalige samenvatting a p p e n d i x B Nederlandstalige samenvatting 110 De hippocampus en de aangrenzende parahippocampale hersenschors zijn hersengebieden die intensief worden onderzocht, met name voor hun rol bij het geheugen.

Nadere informatie

LEREN LEZEN MET DE DAVIS LEERSTRATEGIE.

LEREN LEZEN MET DE DAVIS LEERSTRATEGIE. LEREN LEZEN MET DE DAVIS LEERSTRATEGIE. Leren lezen is een ingewikkeld proces, waarbij heel wat vaardigheden moeten worden ontwikkeld. OBS Dijkerhoek heeft daarom heel bewust gekozen voor de Davis leerstrategie

Nadere informatie

AI Kaleidoscoop. College 9: Natuurlijke taal. Natuurlijke taal: het probleem. Fases in de analyse van natuurlijke taal.

AI Kaleidoscoop. College 9: Natuurlijke taal. Natuurlijke taal: het probleem. Fases in de analyse van natuurlijke taal. AI Kaleidoscoop College 9: atuurlijke taal Het Probleem Grammatica s Transitie netwerken Leeswijzer: Hoofdstuk 14.0-14.3 AI9 1 atuurlijke taal: het probleem Communiceren met computers als met mensen, middels

Nadere informatie

Fonologie. inleiding taalkunde 2012/13 30 mei 2013

Fonologie. inleiding taalkunde 2012/13 30 mei 2013 Fonologie inleiding taalkunde 2012/13 30 mei 2013 Tekst en spraak Representatie van spraak vereist representaties van gedeeltes die kleiner dan woorden zijn. spraaksynthese (tekst-naar-spraak) rijtje letters

Nadere informatie

Spraaktechnologie. Gerrit Bloothooft.

Spraaktechnologie. Gerrit Bloothooft. Spraaktechnologie Gerrit Bloothooft Gerrit.Bloothooft@let.uu.nl Communicatie taal was er eerst als spraak en gebaar pas veel later als schrift - en lezen en schrijven (eerste taaltechnologie) Taal- en

Nadere informatie

Voorlopig onderzoeksplan Bachelorscriptie CleanDoc-

Voorlopig onderzoeksplan Bachelorscriptie CleanDoc- Voorlopig onderzoeksplan Bachelorscriptie 2011 -CleanDoc- Wouter Lockefeer 0545228 Probleemstelling Een goede programmeertaal moet niet alleen efficiënte programma's opleveren, maar ook handig zijn in

Nadere informatie

Flitsend Spellen en Lezen 1

Flitsend Spellen en Lezen 1 Flitsend Spellen en Lezen 1 Flitsend Spellen en Lezen 1 is gericht op het geven van ondersteuning bij het leren van Nederlandse woorden, om te beginnen bij de klanklettercombinaties. Doelgroep Flitsend

Nadere informatie

Herkansing 1 e Deeltentamen Spraakherkenning en -synthese

Herkansing 1 e Deeltentamen Spraakherkenning en -synthese Herkansing 1 e Deeltentamen Spraakherkenning en -synthese Rob van Son 10-13 uur, 20 december 2007 GEBP/P2.27 Dit is een herkansing van het eerste deeltentamen. Je moet deze opgaven alleen maken als je

Nadere informatie

De horizontale lijnen geven de normale luchtdruk weer. Boven de horizontale lijn verhoogt de luchtdruk, onder de lijn vermindert de luchtdruk.

De horizontale lijnen geven de normale luchtdruk weer. Boven de horizontale lijn verhoogt de luchtdruk, onder de lijn vermindert de luchtdruk. Audio Introductie Geluid is een trilling van deeltjes, die zich voortplant in lucht of in een ander medium, zoals water. Een andere definitie: geluid is een voortschrijdende verandering van luchtdruk.

Nadere informatie

Flitsend Spellen en Lezen 1

Flitsend Spellen en Lezen 1 Flitsend Spellen en Lezen 1 Flitsend Spellen en Lezen 1 is gericht op het geven van ondersteuning bij het leren van Nederlandse woorden, om te beginnen bij de klanklettercombinaties. Doelgroep Flitsend

Nadere informatie

Flitsend Spellen en Lezen 1

Flitsend Spellen en Lezen 1 Flitsend Spellen en Lezen 1 Flitsend Spellen en Lezen 1 is gericht op het geven van ondersteuning bij het leren van Nederlandse woorden, om te beginnen bij de klanklettercombinaties. Doelgroep Flitsend

Nadere informatie

Opdracht 1 Topics on Parsing and Formal Languages - fall 2010

Opdracht 1 Topics on Parsing and Formal Languages - fall 2010 Opdracht 1 Topics on Parsing and Formal Languages - fall 2010 Rick van der Zwet 8 december 2010 Samenvatting Dit schrijven zal uitwerkingen van opgaven behandelen uit het boek [JS2009]

Nadere informatie

Uitleg van de Hough transformatie

Uitleg van de Hough transformatie Uitleg van de Hough transformatie Maarten M. Fokkinga, Joeri van Ruth Database groep, Fac. EWI, Universiteit Twente Versie van 17 mei 2005, 10:59 De Hough transformatie is een wiskundige techniek om een

Nadere informatie

LTX016B05. Nieuwe ontwikkelingen in de syntaxis. College 2

LTX016B05. Nieuwe ontwikkelingen in de syntaxis. College 2 LTX016B05 Nieuwe ontwikkelingen in de syntaxis College 2 2/104 Vandaag: 3/104 Vandaag:! Algemene aspecten van de generatieve syntaxistheorie 4/104 Vandaag:! Algemene aspecten van de generatieve syntaxistheorie

Nadere informatie

Automaten & Complexiteit (X )

Automaten & Complexiteit (X ) Automaten & Complexiteit (X 401049) Beschrijven van reguliere talen Jeroen Keiren j.j.a.keiren@gmail.com VU University Amsterdam 5 Februari 2015 Talen Vorig college: Talen als verzamelingen Eindige automaten:

Nadere informatie

In dit gedeelte worden drie problemen genoemd die kunnen voorkomen in netwerken.

In dit gedeelte worden drie problemen genoemd die kunnen voorkomen in netwerken. Aantekening Wiskunde Steiner Aantekening door D. 2086 woorden 25 mei 2016 2,1 1 keer beoordeeld Vak Wiskunde Resultaten Vragen bij het wetenschappelijk materiaal 9.1 Prototype example, p. 374-376 In dit

Nadere informatie

Downloaded from UvA-DARE, the institutional repository of the University of Amsterdam (UvA) http://hdl.handle.net/11245/2.62578

Downloaded from UvA-DARE, the institutional repository of the University of Amsterdam (UvA) http://hdl.handle.net/11245/2.62578 Downloaded from UvA-DARE, the institutional repository of the University of Amsterdam (UvA) http://hdl.handle.net/11245/2.62578 File ID Filename Version uvapub:62578 Belangrijke begrippen final SOURCE

Nadere informatie

Opdracht 1 Topics on Parsing and Formal Languages - fall 2010

Opdracht 1 Topics on Parsing and Formal Languages - fall 2010 Opdracht 1 Topics on Parsing and Formal Languages - fall 2010 Rick van der Zwet 13 november 2010 Samenvatting Dit schrijven zal uitwerkingen van opgaven behandelen uit het boek [JS2009]

Nadere informatie

start -> id (k (f c s) (g s c)) -> k (f c s) (g s c) -> f c s -> s c

start -> id (k (f c s) (g s c)) -> k (f c s) (g s c) -> f c s -> s c Een Minimaal Formalisme om te Programmeren We hebben gezien dat Turing machines beschouwd kunnen worden als universele computers. D.w.z. dat iedere berekening met natuurlijke getallen die met een computer

Nadere informatie

Fonemisch Bewustzijn

Fonemisch Bewustzijn Fonemisch Bewustzijn Ellen van der Veen Welkom en Agenda 1. Introductie 2. Fonemisch Bewustzijn 3. Vragen en praktijkervaringen Doelstellingen van vandaag 1. De deelnemers kennen de begrippen taalbewustzijn,

Nadere informatie

recursie Hoofdstuk 5 Studeeraanwijzingen De studielast van deze leereenheid bedraagt circa 6 uur. Terminologie

recursie Hoofdstuk 5 Studeeraanwijzingen De studielast van deze leereenheid bedraagt circa 6 uur. Terminologie Hoofdstuk 5 Recursion I N T R O D U C T I E Veel methoden die we op een datastructuur aan kunnen roepen, zullen op een recursieve wijze geïmplementeerd worden. Recursie is een techniek waarbij een vraagstuk

Nadere informatie

SAMENVATTING Het doel van dit proefschrift is drieledig. Ten eerste wordt inzicht verschaft in het gebruik van directe-rede-constructies (bijvoorbeeld Marie zei: Kom, we gaan! ) door sprekers met afasie.

Nadere informatie

Inhoud. Introductie tot de cursus

Inhoud. Introductie tot de cursus Inhoud Introductie tot de cursus 1 Plaats en functie van de cursus 7 2 Inhoud van de cursus 7 2.1 Tekstboek 7 2.2 Voorkennis 8 2.3 Leerdoelen 8 2.4 Opbouw van de cursus 9 3 Leermiddelen en wijze van studeren

Nadere informatie

Het Muiswerkprogramma Grammatica op maat bestrijkt de grammatica die nodig is voor het leren van de Nederlandse spelling en zinsbouw.

Het Muiswerkprogramma Grammatica op maat bestrijkt de grammatica die nodig is voor het leren van de Nederlandse spelling en zinsbouw. Grammatica op maat Het Muiswerkprogramma Grammatica op maat bestrijkt de grammatica die nodig is voor het leren van de Nederlandse spelling en zinsbouw. Doelgroepen Grammatica op maat Dit programma is

Nadere informatie

Voorbeeld casus mondeling college-examen

Voorbeeld casus mondeling college-examen Voorbeeld casus mondeling college-examen Examenvak en niveau informatica vwo Naam kandidaat Examennummer Examencommissie Datum Voorbereidingstijd Titel voorbereidingsopdracht 20 minuten van analoog naar

Nadere informatie

Cover Page. The handle holds various files of this Leiden University dissertation

Cover Page. The handle  holds various files of this Leiden University dissertation Cover Page The handle http://hdl.handle.net/1887/22286 holds various files of this Leiden University dissertation Author: Nezhinsky, A.E. Title: Pattern recognition in high-throughput zebrafish imaging

Nadere informatie

Automaten. Informatica, UvA. Yde Venema

Automaten. Informatica, UvA. Yde Venema Automaten Informatica, UvA Yde Venema i Inhoud Inleiding 1 1 Formele talen en reguliere expressies 2 1.1 Formele talen.................................... 2 1.2 Reguliere expressies................................

Nadere informatie

Muiswerk Strategisch Lezen is gericht op het aanleren van deelvaardigheden die nodig zijn voor een strategische leesaanpak.

Muiswerk Strategisch Lezen is gericht op het aanleren van deelvaardigheden die nodig zijn voor een strategische leesaanpak. Strategisch Lezen Muiswerk Strategisch Lezen is gericht op het aanleren van deelvaardigheden die nodig zijn voor een strategische leesaanpak. Doelgroepen Strategisch Lezen Muiswerk Strategisch Lezen is

Nadere informatie

Exponentiële Functie: Toepassingen

Exponentiële Functie: Toepassingen Exponentiële Functie: Toepassingen 1 Overgang tussen exponentiële functies en lineaire functies Wanneer we werken met de exponentiële functie is deze niet altijd gemakkelijk te herkennen. Daarom proberen

Nadere informatie

Tentamen Kunstmatige Intelligentie (INFOB2KI)

Tentamen Kunstmatige Intelligentie (INFOB2KI) Tentamen Kunstmatige Intelligentie (INFOB2KI) 30 januari 2014 10:30-12:30 Vooraf Mobiele telefoons dienen uitgeschakeld te zijn. Het tentamen bestaat uit 7 opgaven; in totaal kunnen er 100 punten behaald

Nadere informatie

8. Logogrammen. Soemer. Uitbreiding

8. Logogrammen. Soemer. Uitbreiding 8. Logogrammen Soemer Ongeveer 5 duizend jaar geleden woonde in Zuid-Oost Irak een volk dat de Soemeriërs werd genoemd. Zelf noemden ze hun land ki-en-gir, het land van de beschaafde heersers. De Soemeriërs

Nadere informatie

A1 A2 B1 B2 C1. betrekking op concrete betrekking op abstracte, complexe, onbekende vertrouwde

A1 A2 B1 B2 C1. betrekking op concrete betrekking op abstracte, complexe, onbekende vertrouwde Luisteren - kwalitatieve niveaucriteria en zinsbouw tempo en articulatie Teksten hebben Teksten hebben Teksten hebben Teksten hebben Teksten hebben o.a. betrekking op zeer betrekking op betrekking op betrekking

Nadere informatie

The knight s tour. Het paard in schaken beweegt als volgt: Steeds 1 vakje in een richting en 2 in een andere richting, of omgekeerd.

The knight s tour. Het paard in schaken beweegt als volgt: Steeds 1 vakje in een richting en 2 in een andere richting, of omgekeerd. The knight s tour In het Engels heet een paard uit schaken een Knight (Ridder). In het begin zaten er namelijk ridders op de paarden. (link wiki) Stel, je bent een paard uit het schaakspel en je staat

Nadere informatie

Zoemzinnen. Algemene info. Functies met een variabel aantal argumenten

Zoemzinnen. Algemene info. Functies met een variabel aantal argumenten Zoemzinnen Functies met een variabel aantal argumenten Bij het definiëren van een functie leg je in principe vast hoeveel argumenten er aan de functie moeten doorgegeven worden. Dit aantal correspondeert

Nadere informatie

Leerlijnen peuters en jonge kind (MET extra doelen) versie juli 2015. Naam leerling. Taal Beginnende geletterdheid

Leerlijnen peuters en jonge kind (MET extra doelen) versie juli 2015. Naam leerling. Taal Beginnende geletterdheid Leerlijnen peuters en jonge kind (MET extra doelen) versie juli 2015 Taal eginnende geletterdheid eginnende geletterdheid-stap 1 OEKORIËNTATIE: Herkent een boek en weet dat er een verhaal in staat -20--20

Nadere informatie

Hersenonderzoek en intelligentie

Hersenonderzoek en intelligentie 45 Hersenonderzoek en intelligentie U werkt als psycholoog-onderzoeker aan de universiteit. Binnenkort bezoekt u samen met een collega het symposium Hersenen en intelligentie. U hebt afgesproken dat ieder

Nadere informatie

Dit programma is gemaakt voor leerlingen van groep 4 en 5 van de basisschool, het praktijkonderwijs, vmbo bbl en mbo 1.

Dit programma is gemaakt voor leerlingen van groep 4 en 5 van de basisschool, het praktijkonderwijs, vmbo bbl en mbo 1. Spelling op maat 1 De Muiswerkprogramma s Spelling op maat 1, 2 en 3 vormen een complete leerlijn voor de spelling die op de basisschool moet worden aangeleerd. Spelling op maat 1 is het eerste deel van

Nadere informatie

Natuurlijke-taalverwerking 1. Daniël de Kok

Natuurlijke-taalverwerking 1. Daniël de Kok Natuurlijke-taalverwerking 1 Daniël de Kok Natuurlijke-Taalverwerking Het college Natuurlijke-taalverwerking is een inleiding in de computationele taalkunde en maakt deel uit van het curriculum van Informatiekunde

Nadere informatie

Dit programma is gemaakt voor leerlingen van groep 7 en 8 van de basisschool, alle niveaus van het vmbo en mbo 1 en 2.

Dit programma is gemaakt voor leerlingen van groep 7 en 8 van de basisschool, alle niveaus van het vmbo en mbo 1 en 2. Spelling op maat 3 De Muiswerkprogramma s Spelling op maat 1, 2 en 3 vormen een complete leerlijn voor de spelling die op de basisschool moet worden aangeleerd. Spelling op maat 3 is het derde deel van

Nadere informatie

Informatie over het werkgeheugen

Informatie over het werkgeheugen Informatie over het werkgeheugen Wat is het Werkgeheugen? De mogelijkheid om informatie van verschillende aard vast te houden en deze informatie te gebruiken in een denkproces waarbij nieuwe en reeds aanwezige

Nadere informatie

Cover Page. The handle holds various files of this Leiden University dissertation.

Cover Page. The handle  holds various files of this Leiden University dissertation. Cover Page The handle http://hdl.handle.net/1887/20554 holds various files of this Leiden University dissertation. Author: Lai, Jun Title: The learnability of center-embedded recursion : experimental studies

Nadere informatie

Visuele aandachtspanne. Madelon van den Boer Universiteit van Amsterdam

Visuele aandachtspanne. Madelon van den Boer Universiteit van Amsterdam Visuele aandachtspanne Madelon van den Boer Universiteit van Amsterdam Programma Waarom visuele aandachtspanne (VAS)? Wat is VAS? Relatie met lezen Recente ontwikkelingen Samenvatting Vragen Dyslexie Een

Nadere informatie

Inleiding taalkunde. Inleiding - 23 april 2013 Marieke Schouwstra

Inleiding taalkunde. Inleiding - 23 april 2013 Marieke Schouwstra Inleiding taalkunde Inleiding - 23 april 2013 Marieke Schouwstra 1 Dit college Overzicht cursus Wat is natuurlijke taal? Wat is taalkunde? 2 Docenten Marieke Schouwstra taalevolutie en betekenis Yoad Winter

Nadere informatie

Samenvatting Impliciet leren van kunstmatige grammatica s: Effecten van de complexiteit en het nut van de structuur

Samenvatting Impliciet leren van kunstmatige grammatica s: Effecten van de complexiteit en het nut van de structuur Samenvatting Impliciet leren van kunstmatige grammatica s: Effecten van de complexiteit en het nut van de structuur Hoewel kinderen die leren praten geen moeite lijken te doen om de regels van hun moedertaal

Nadere informatie

Zo gaat jouw kunstwerk er straks uitzien. Of misschien wel heel anders.

Zo gaat jouw kunstwerk er straks uitzien. Of misschien wel heel anders. Spirograaf in Python Een kunstwerk maken Met programmeren kun je alles maken! Ook een kunstwerk! In deze les maken we zelf een kunstwerk met Python. Hiervoor zal je werken met herhalingen en variabelen.

Nadere informatie

Inhoudsopgave Voorwoord 5 Voordat je begint 6 Wat heb je nodig? 7 De website bij het boek 7 Voor ouders, verzorgers en leraren

Inhoudsopgave Voorwoord 5 Voordat je begint 6 Wat heb je nodig? 7 De website bij het boek 7 Voor ouders, verzorgers en leraren Inhoudsopgave Voorwoord... 5 Voordat je begint... 6 Wat heb je nodig?... 7 De website bij het boek... 7 Voor ouders, verzorgers en leraren... 8 Vervolgboeken over programmeren... 8 1. Aan de slag met Python

Nadere informatie

Speaking of Reading. The Role of Basic Auditory and Speech Processing in the Manifestation of Dyslexia in Children at Familial Risk B.E.

Speaking of Reading. The Role of Basic Auditory and Speech Processing in the Manifestation of Dyslexia in Children at Familial Risk B.E. Speaking of Reading. The Role of Basic Auditory and Speech Processing in the Manifestation of Dyslexia in Children at Familial Risk B.E. Hakvoort Samenvatting Dyslexie komt voor bij ongeveer 3 tot 10%

Nadere informatie

Voorbeeld casus mondeling college-examen

Voorbeeld casus mondeling college-examen Voorbeeld casus mondeling college-examen Examenvak en niveau informatica havo Naam kandidaat Examennummer Examencommissie Datum Voorbereidingstijd Titel voorbereidingsopdracht 20 minuten van analoog naar

Nadere informatie

Inleiding Tijdens deze les maken de leerlingen een programma om een bericht in morsecode te versturen en ontcijferen ze gecodeerde berichten.

Inleiding Tijdens deze les maken de leerlingen een programma om een bericht in morsecode te versturen en ontcijferen ze gecodeerde berichten. Morse code Les 7 Leerkrachthandleiding Basis Inleiding Tijdens deze les maken de leerlingen een programma om een bericht in morsecode te versturen en ontcijferen ze gecodeerde berichten. Lesdoelen De leerlingen

Nadere informatie

Algemene Taalwetenschap. Hogeschool van Amsterdam Josefien Sweep

Algemene Taalwetenschap. Hogeschool van Amsterdam Josefien Sweep Algemene Taalwetenschap Hogeschool van Amsterdam Josefien Sweep Fonetiek en Fonologie Fonetiek en fonologie gaan over spraak (klanken): het gebruik van de stem om te communiceren. Spraak is het belangrijkste

Nadere informatie

Introductie tot de cursus

Introductie tot de cursus Inhoud introductietalen en ontleders Introductie tot de cursus 1 Plaats en functie van de cursus 7 2 Inhoud van de cursus 7 2.1 Voorkennis 7 2.2 Leerdoelen 8 2.3 Opbouw van de cursus 8 3 Leermiddelen en

Nadere informatie

Halma Bot: Monte Carlo versus Alpha-Beta

Halma Bot: Monte Carlo versus Alpha-Beta : Monte Carlo versus Alpha-Beta Inleiding Marijn Biekart-11032278, Artemis Çapari-11336390, Jesper van Duuren-10780793, Jochem Hölscher-11007729 en Reitze Jansen-11045442 Zoeken, Sturen en Bewegen 30 juni

Nadere informatie

Werkgeheugen bij kinderen met SLI. Indeling presentatie. 1. Inleiding. Brigitte Vugs, 19 maart 2009. 1. Inleiding 2. Theoretische achtergrond

Werkgeheugen bij kinderen met SLI. Indeling presentatie. 1. Inleiding. Brigitte Vugs, 19 maart 2009. 1. Inleiding 2. Theoretische achtergrond Werkgeheugen bij kinderen met SLI Brigitte Vugs, 19 maart 2009 Indeling presentatie 1. Inleiding 2. Theoretische achtergrond SLI, Geheugen, Werkgeheugen 3. Ontwikkeling werkgeheugen 4. Relatie werkgeheugen

Nadere informatie

Samenvatting. Context. Doelstellingen. Vaardigheden computationeel denken. Katholiek onderwijs. Gemeenschapsonderwijs

Samenvatting. Context. Doelstellingen. Vaardigheden computationeel denken. Katholiek onderwijs. Gemeenschapsonderwijs Music componist Samenvatting Leeftijd 10-12 jaar Vaardigheden algoritme en procedure decompositie van het probleem voorspellen Totale tijdsduur 150 minuten De leerlingen ontdekken hoe ze een liedje kunnen

Nadere informatie

opgaven formele structuren deterministische eindige automaten

opgaven formele structuren deterministische eindige automaten opgaven formele structuren deterministische eindige automaten Opgave. De taal L over het alfabet {a, b} bestaat uit alle strings die beginnen met aa en eindigen met ab. Geef een reguliere expressie voor

Nadere informatie

Ontsluiten van gesproken documenten. Arjan van Hessen

Ontsluiten van gesproken documenten. Arjan van Hessen SpraakTech Ontsluiten van gesproken documenten Arjan van Hessen spraak tekst spraak verslag emotiedetectie emotiedetectie geeft GEEN antwoord op vragen herkennen van sprekers groeperen van verschillende

Nadere informatie

Aan het begin verliet Tony Campmans ons team, we hebben dus het hele project met één persoon minder gewerkt.

Aan het begin verliet Tony Campmans ons team, we hebben dus het hele project met één persoon minder gewerkt. INFOB1PICA 2013-2014 EINDVERSLAG Team 5: Solvify 1. Individuele teamleden en algemene informatie Studentnr Naam Uren 4153553 Joost Besseling 143 4145607 Coen Boot 161 4146603 Joost Houben 171 4088646 Michiel

Nadere informatie

Cover Page. The handle http://hdl.handle.net/1887/20932 holds various files of this Leiden University dissertation.

Cover Page. The handle http://hdl.handle.net/1887/20932 holds various files of this Leiden University dissertation. Cover Page The handle http://hdl.handle.net/1887/20932 holds various files of this Leiden University dissertation. Author: Haar, Sita Minke ter Title: Birds and babies : a comparison of the early development

Nadere informatie

02 SCNL: Cursus Het oplossen van een Sudoku met de juiste hoeveelheid informatie

02 SCNL: Cursus Het oplossen van een Sudoku met de juiste hoeveelheid informatie Inhoudsopgave 1. Inleiding tot de cursus... 4 2. Wat is een Sudoku, Sudoku begrippen en definities... 6 3. Basisregels voor het oplossen van een Sudoku + Sudoku oplostips...11 4. Methodes om een Sudoku

Nadere informatie

Onafhankelijke verzamelingen en Gewogen Oplossingen, door Donald E. Knuth, The Art of Computer Programming, Volume 4, Combinatorial Algorithms

Onafhankelijke verzamelingen en Gewogen Oplossingen, door Donald E. Knuth, The Art of Computer Programming, Volume 4, Combinatorial Algorithms Onafhankelijke verzamelingen en Gewogen Oplossingen, door Donald E. Knuth, The Art of Computer Programming, Volume 4, Combinatorial Algorithms Giso Dal (0752975) Pagina s 5 7 1 Deelverzameling Representatie

Nadere informatie

Stelling. SAT is NP-compleet.

Stelling. SAT is NP-compleet. Het bewijs van de stelling van Cook Levin zoals gegeven in het boek van Sipser gebruikt niet-deterministische turing machines. Het is inderdaad mogelijk de klasse NP op een alternatieve wijze te definiëren

Nadere informatie

Welkom en Agenda. Workshop Fonemisch Bewustzijn. Doelstellingen van vandaag. Fonologie. Doorgaande lijn

Welkom en Agenda. Workshop Fonemisch Bewustzijn. Doelstellingen van vandaag. Fonologie. Doorgaande lijn Welkom en Agenda 1. Introductie 2. Fonemisch Bewustzijn 3. Vragen en praktijkervaringen Workshop Fonemisch Bewustzijn Ellen van der Veen Doelstellingen van vandaag 1. De deelnemers kennen de begrippen

Nadere informatie

LEREN ONDERSTEUNEN MET EEN MINDMAP

LEREN ONDERSTEUNEN MET EEN MINDMAP LEREN ONDERSTEUNEN MET EEN MINDMAP Praktische uitvoering 1 DE RODE DRAAD 2 KORTWEG woorden uit een brainstorm verzamelen om vervolgens te groeperen en structureren in een mindmap. De aldus ontstane mindmap

Nadere informatie

Artificiële intelligentie 1 ( ) Voorbeelden van examenvragen

Artificiële intelligentie 1 ( ) Voorbeelden van examenvragen Artificiële intelligentie 1 (2002-2003) Voorbeelden van examenvragen Tony Belpaeme, Bart de Boer, Bart De Vylder, Bart Jansen Vraag 1. Wat zal het effect zijn van een convolutiekernel a. Contrast wordt

Nadere informatie

Geluid-gevoel pads voor dove mensen

Geluid-gevoel pads voor dove mensen 1 Geluid-gevoel pads voor dove mensen 1 20 2 30 De uitvinding voor dove mensen heeft betrekking op geluidswaarnemingen waarbij geluiden trillen in pads en voelbaar worden door aanraking met de huid. Door

Nadere informatie

De Arduino-microcontroller in de motorvoertuigentechniek (2)

De Arduino-microcontroller in de motorvoertuigentechniek (2) De Arduino-microcontroller in de motorvoertuigentechniek (2) E. Gernaat (ISBN 978-90-79302-11-6) 1 Procescomputer 1.1 Microprocessoren algemeen De informatie-verwerking zoals is behandeld, is vrijwel geheel

Nadere informatie

FICHE 5: Ga auditieve informatieverwerking

FICHE 5: Ga auditieve informatieverwerking 2015 1 FICHE 5: Ga auditieve informatieverwerking KENMERKEN EN AANBEVELINGEN [Typ hier] UIT: Intelligentiemeting in nieuwe banen: de integratie van het CHC-model in de psychodiagnostische praktijk. Walter

Nadere informatie

VOLAUTOMATISCH TEKSTEN SAMENVATTEN

VOLAUTOMATISCH TEKSTEN SAMENVATTEN VOLAUTOMATISCH TEKSTEN SAMENVATTEN VAT SAMEN MET DE SUMMARIZER Iedereen is inmiddels bekend met de term Big data de groeiende hoeveelheid door machines gegenereerde informatie uitgedrukt in cijfers en

Nadere informatie

Dit programma is gemaakt voor leerlingen van eind groep 3 en groep 4 van de basisschool, het praktijkonderwijs, vmbo bbl en mbo 1.

Dit programma is gemaakt voor leerlingen van eind groep 3 en groep 4 van de basisschool, het praktijkonderwijs, vmbo bbl en mbo 1. Spelling op maat 1 De programma s Spelling op maat 1, 2 en 3 vormen een complete leerlijn voor de spelling die op de basisschool moet worden aangeleerd. Spelling op maat 1 is het eerste deel van deze leerlijn.

Nadere informatie

Kleuters leren lezen

Kleuters leren lezen Kleuters leren lezen Lerespel Inhoudsopgave INLEIDING... 3 STAP 1: KINDEREN MOETEN EERST BESEFFEN WAT LEZEN IS EN WAAROM HET HANDIG IS OM HET TE KUNNEN.... 4 STAP 2: DE VOORBEREIDING OP HET ZELF LEZEN;

Nadere informatie

HOOFDSTUK 3. Imperatief programmeren. 3.1 Stapsgewijs programmeren. 3.2 If Then Else. Module 4 Programmeren

HOOFDSTUK 3. Imperatief programmeren. 3.1 Stapsgewijs programmeren. 3.2 If Then Else. Module 4 Programmeren HOOFDSTUK 3 3.1 Stapsgewijs programmeren De programmeertalen die tot nu toe genoemd zijn, zijn imperatieve of procedurele programmeertalen. is het stapsgewijs in code omschrijven wat een programma moet

Nadere informatie

SECTORWERKSTUK 2013-2014

SECTORWERKSTUK 2013-2014 SECTORWERKSTUK 2013-2014 1 HET SECTORWERKSTUK Het sectorwerkstuk is een verplicht onderdeel voor alle leerlingen uit het Mavo. Het maken van een sectorwerkstuk is een manier waarop je, als eindexamenkandidaat,

Nadere informatie

Variabelen en statements in ActionScript

Variabelen en statements in ActionScript Ontwikkelen van Apps voor ios en Android Variabelen en statements in ActionScript 6.1 Inleiding Als we het in de informatica over variabelen hebben, bedoelen we een stukje in het geheugen van de computer

Nadere informatie

Eindexamen Filosofie havo I

Eindexamen Filosofie havo I Opgave 2 Denken en bewustzijn 8 Een goed antwoord bevat de volgende elementen: een omschrijving van het begrip bewustzijn 2 argumentatie aan de hand van deze omschrijving of aan Genghis bewustzijn kan

Nadere informatie

hoofdstuk 1 Prezi: een zooming interface

hoofdstuk 1 Prezi: een zooming interface hoofdstuk 1 Prezi: een zooming interface In dit hoofdstuk leg ik uit wat Prezi is, waar het vandaan komt en wat Prezi zo bijzonder maakt. Hierbij grijp ik onder andere terug op de verschillen tussen onze

Nadere informatie

HANDLEIDING EUROGLOT TRANSLATOR MODULE

HANDLEIDING EUROGLOT TRANSLATOR MODULE Linguistic Systems BV - Euroglot 2013 Leo Konst Handleiding voor het gebruik van de Euroglot Translator vertaalmodule. Euroglot Translator is een nieuw product in de Euroglot reeks, dat de Euroglot Professional

Nadere informatie

Oplossingen oefeningen logica en eindige automaten 12 december Het bestand oplnoef12dec.zip bevat de.sen en.fa bestanden met de oplossingen.

Oplossingen oefeningen logica en eindige automaten 12 december Het bestand oplnoef12dec.zip bevat de.sen en.fa bestanden met de oplossingen. Oplossingen oefeningen logica en eindige automaten 12 december 2003 Het bestand oplnoef12dec.zip bevat de.sen en.fa bestanden met de oplossingen. Oefening 1 Deel 1: Logica Vertaal de volgende zinnen in

Nadere informatie

3 De stelling van Kleene

3 De stelling van Kleene 18 3 De stelling van Kleene Definitie 3.1 Een formele taal heet regulier als hij wordt herkend door een deterministische eindige automaat. Talen van de vorm L(r) met r een reguliere expressie noemen we

Nadere informatie

Verbonden spraak. Vloeiend Nederlands spreken kan je leren.

Verbonden spraak. Vloeiend Nederlands spreken kan je leren. Verbonden spraak Vloeiend Nederlands spreken kan je leren. Als ik een boek was... Trek een nummer (1 tot 28). Als ik een boek was gaat rond. Noteer de zin die bij je pagina hoort. Vloeiend? Hoe kan je

Nadere informatie

TELEPORTEREN MET VARIABELEN

TELEPORTEREN MET VARIABELEN 2 TELEPORTEREN MET VARIABELEN Ben je zover dat je de kracht van Python kunt gebruiken om jouw Minecraft wereld te beheersen? In dit hoofdstuk krijg je een korte rondleiding langs de basisbegrippen van

Nadere informatie

Als een PSD selecties bevat, deelt de lijn van het programma zich op met de verschillende antwoorden op het vraagstuk.

Als een PSD selecties bevat, deelt de lijn van het programma zich op met de verschillende antwoorden op het vraagstuk. HOOFDSTUK 3 3.1 Stapsgewijs programmeren In de vorige hoofdstukken zijn programmeertalen beschreven die imperatief zijn. is het stapsgewijs in code omschrijven wat een programma moet doen, net als een

Nadere informatie

HANDLEIDING EUROGLOT TRANSLATOR MODULE

HANDLEIDING EUROGLOT TRANSLATOR MODULE Linguistic Systems BV - Euroglot 2017 Leo Konst HANDLEIDING MODULE Handleiding voor het gebruik van de Euroglot Translator vertaalmodule. Euroglot Translator is een nieuw product in de Euroglot reeks,

Nadere informatie

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008 Examen Statistische Modellen en Data-analyse Derde Bachelor Wiskunde 14 januari 2008 Vraag 1 1. Stel dat ɛ N 3 (0, σ 2 I 3 ) en dat Y 0 N(0, σ 2 0) onafhankelijk is van ɛ = (ɛ 1, ɛ 2, ɛ 3 ). Definieer

Nadere informatie

2. Syntaxis en semantiek

2. Syntaxis en semantiek 2. Syntaxis en semantiek In dit hoofdstuk worden de begrippen syntaxis en semantiek behandeld. Verder gaan we in op de fouten die hierin gemaakt kunnen worden en waarom dit in de algoritmiek zo desastreus

Nadere informatie

Trillingen en geluid wiskundig. 1 De sinus van een hoek 2 Uitwijking van een trilling berekenen 3 Macht en logaritme 4 Geluidsniveau en amplitude

Trillingen en geluid wiskundig. 1 De sinus van een hoek 2 Uitwijking van een trilling berekenen 3 Macht en logaritme 4 Geluidsniveau en amplitude Trillingen en geluid wiskundig 1 De sinus van een hoek 2 Uitwijking van een trilling berekenen 3 Macht en logaritme 4 Geluidsniveau en amplitude 1 De sinus van een hoek Eenheidscirkel In de figuur hiernaast

Nadere informatie

BRAINTRAINING VOOR WERK EN STUDIE. Overzicht modules

BRAINTRAINING VOOR WERK EN STUDIE. Overzicht modules BRAINTRAINING VOOR WERK EN STUDIE Overzicht modules Overzicht training Je krijgt een globaal inzicht in de werking van de hersenen en leert technieken om: Je hersencapaciteit beter te benutten sneller

Nadere informatie

Plan van Aanpak Afstuderen

Plan van Aanpak Afstuderen Plan van Aanpak Afstuderen Michiel Graat 27-09-2005 Inhoudsopgave 1 Inleiding 3 1.1 Terminologie............................. 3 1.2 Opdracht............................... 4 1.3 JavaCard...............................

Nadere informatie