Natuurlijke Taalverwerking I shift-reduce en chart parsing

Maat: px
Weergave met pagina beginnen:

Download "Natuurlijke Taalverwerking I shift-reduce en chart parsing"

Transcriptie

1 Natuurlijke Taalverwerking I shift-reduce en chart parsing Gosse Bouma en Geert Kloosterman 2e semester 2005/2006

2 Shift-reduce conflicten Epsilon-regels Breadth-first zoeken Gebruik van een chart Toepassing: Alpino Overzicht 1

3 Parse-strategieën Prolog (DCG) zoekt top-down, depth-first. Alternatieven: Bottom-up: Begin bij de input (woorden), werk naar de startcategorie (s) toe. Breadth-first: Onderzoek alle mogelijke manieren om zinsdelen te vormen parallel. Alternatieve methode s zijn vaak robuuster en efficiënter. 2

4 Shift-reduce Algoritme stap invoer stapel actie 1. de hond snurkt [ ] shift 2. hond snurkt [Det] shift 3. snurkt [Det N] reduce 4. snurkt [NP] shift 5. [NP V] reduce 6. [NP VP] reduce 7. [S] 3

5 Ambiguïteit Kim kocht het huis met de garage. Kim kocht het huis in vp v np vp vp pp np np pp 4

6 Shift-reduce conflict String Stack actie regel 1. kocht het huis [].... met de garage.... m. met de garage [v,np] red vp v np n. met de garage [vp]... o. [vp,pp] red vp vp pp m. met de garage [v,np] shift lex(met,p).. p. [v,np,pp] red np np pp q. [v,np].. 5

7 Hoofd- en bijzinnen Piet slaapt Jan denkt dat Piet slaapt Piet leest een boek Jan denkt dat Piet een boek leest s np vp vp v np vp v vp v [dat] bijzin bijzin np vpb vpb np v vpb v 6

8 Reduce-reduce conflict String Stack actie regel 1. Jan denkt dat [] Piet slaapt m. [..,dat,np,v] red vp v n. [..,dat,np,vp] red s np vp o. [..dat,s]..... m. [..,dat,np,vp] red vpb v n. [..,dat,np,vpb] red bz np, vpb o [..dat,bz].... 7

9 Voordelen van shift-reduce algoritme Links-recursie is geen probleem. Omvang van de stack is nooit groter dan aantal woorden in de input. Parsing termineert zolang de grammatica geen cyclische regels bevat. np n n np 8

10 Elk voordeel hep z n nadeel det ɛ Epsilon-regels voegen een categorie toe aan de stack, zonder dat dit correspondeert met een element van de input, Omvang van de stack is niet langer kleiner of gelijk aan de input, Epsilon-regels kunnen ertoe leiden dat de parsing niet termineert. 9

11 SR en Epsilon s String Stack actie regel 1 honden blaffen [] sh 2 honden blaffen [det] sh 3 honden blaffen [det,det] sh... 10

12 Eliminatie van Epsilons Het effect van epsilon-regels kan ook altijd door regels zonder epsilon bereikt worden, Iedere grammatica met epsilons heeft een equivalente grammatica zonder epsilons. np det n det ɛ np n 11

13 Eliminatie van Epsilons Voor alle regels C ɛ en alle regels M C 1...C i,c,c j...c n, voeg toe M C 1...C i,c j...c n. 12

14 Efficiëntie DCG en shift-reduce parsers zoeken normaalgesproken depth-first: verschillende oplossingen worden gevonden door backtracking, Depth-first parsing kan erg inefficient zijn, Breadth-first parsing is meestal veel sneller, Chart-parsers zijn Breadth-first parsers. 13

15 Depth-first zoeken Als er een keuze is (tussen regels, tussen shift or reduce acties), onderzoek je 1 mogelijkheid volledig (depth-first), en andere mogelijkheden pas als de eerste keuze faalt. Maakt meestal gebruik van back-tracking. 14

16 Depth-first parsing DCG: top-down, depth-first Shift-reduce: bottom-up, depth-first 15

17 Nadelen van backtracking De spectaculaire groei van het Amsterdamse bureau Franzen, Hey & Veltman ( FHV ) heeft zich ook vorig jaar voortgezet. De invloed van de omvorming van de Oosteuropese economien op de vraag naar Duitse Marken is moeilijk kwantificeerbaar 16

18 SR parsing en Backtracking String Stack action 0 de groei van... [] 3 van het Amsterdamse.. [det,n] red 4 van het Amsterdamse.. [np]... n heeft zich ook [np,pp] sh... (fail) 3 van het Amsterdamse.. [det,n] sh n heeft zich ook [det,n,pp] red.. PP van het... ( FHV ) wordt twee keer afgeleid. 17

19 Oorzaken van backtracking Ambiguïteit, Wens om alle parses te vinden, Ongrammaticale input. 18

20 Partial Parsing Vind alle NPs (of een andere categorie) in een input, Implementatie met een shift-reduce parser: Parse alle substrings van de input, Maar een input van lengte 20 heeft substrings Veel NPs worden onderweg meerdere malen herkend... 19

21 Chart Parsing Bereken nooit iets twee keer! Bewaar resultaten in een tabel (chart), B.v. een lijst van constituenten die zijn gevonden in de input (well-formed substring table). 20

22 Een chart s vp np s n vp pp np np np tv det n p det n marie ziet de jongen met de hond 21

23 Een chart als een lijst 0 Marie 1 ziet 2 de 3 jongen 4 met 5 de 6 hond 7 0,1,np 1,2,tv 2,3,det 3,4,n 2,4,np 1,4,vp 0,4,s 4,5,p 5,6,det 6,7,n 5,7,np 4,7,pp 1,7,vp 3,7,np 0,7,s 22

24 Chart Parsing Doel: Vind alle constituenten in de input, Succes: Er is een constituent in de chart die de hele input beslaat en van categorie S is. 23

25 Chart Parsing Regel 1 Voeg item i, i + 1, Cat toe als er a word W is op positie i met categorie Cat. Regel 2 Voeg item i, n, Cat toe als er een regel Cat C 1...C n is en items i, j, C 1... m, n, C n 24

26 Prolog Chart: verzameling feiten constituent(begin,eind,categorie). Items toevoegen: gebruik assert. Loop van links naar rechts door de string, Op iedere positie: voeg alle mogelijke items (eenmalig) toe aan de chart (m.b.v. een failure-driven loop). 25

27 Partial Parsing Vind alle NPs in de invoer, Geen volledige parse (grammatica) nodig. Gemakkelijk met een chart, Moeilijk (en langzaam) met een shift-reduce parser. 26

28 Partial Parsing Experiment Runtime (ms) Zinnen Shift-Reduce Chart

29 Opgave 3 Implementatie van een chart parser in Prolog is gegeven, Schrijf predicaten om het resultaat van parsing aan een gebruiker te tonen, Werk met een corpus dat reeds voorzien is van woordsoorten, Schrijf grammatica-regels voor NP s die beginnen met een getal, voor PP s die een NP zonder lidwoord bevatten. 28

30 Voorbeeld zin(13,[art(bep,zijd_of_mv,neut, De ), adj(attr,stell,verv_neut,enige), n(soort,ev,neut,maatregel), [De enige maatregel] die [de Duitsers] mogen nemen om hun boeren te beschermen tegen [de gevolgen van de koersstijging van de mark] is [een concrete sluiting van de grenzen] voor buitenlandse granen en zuivelprodukten. 29

31 Alpino-grammatica 500 (gedetailleerde) regels, 100K (gedetailleerde) lexical entries, unknown word guesser, Part-of-Speech tagging, Statistisch model om de beste parse van een zin te vinden, Output is een boom met dependentie-relaties 30

32 Alpino Treebank Evaluatie Alpino-grammatica woorden krantentekst, automatisch geanalyseerd, handmatig gecorrigeerd Corpus Accuratesse (%) Alpino cdbl eindhoven 85.9 TwNC trouw CLEF03 vragen 92.6 CLEF04 vragen

33 Toepassingen Alpino-grammatica CLEF-corpus Algemeen Dagblad, NRC Handelsblad 1994, 1995 Aantal woorden 79 mln Aantal zinnen 4,1 mln Geen parse 0.3% Fragment parse 8.9% Volledige parse 90.8% CPU uren 20,000 XML 25 Gb 32

34 Toepassingen Alpino-grammatica Question Answering: Welke wiskundige bewees de Stelling van Fermat? Afgelopen maandagavond heeft de wiskundige Andrew Wiles in het McCoshAuditorium... bekend gemaakt dat zijn bewijs van de Laatste Stelling van Fermat,... Classificatie van vragen (Person, Date, Measure,...), Identificatie van vragen op basis van syntactische analyse 33

35 Toepassingen Alpino-grammatica Corpus-Taalkunde: Werkwoordelijke uitdrukkingen (rekening houden met), voorzetseluitdrukkingen (ten opzichte van), zelfstandige naamwoorden met vast voorzetsel (behoefte aan, bezwaar tegen, onderzoek naar,..), Leren van Ontologische kennis: isa-relaties (aandoening: achalasie amyotrofe lateraalsclerose, atherosclerose, borstklierontsteking,..). 34

Natuurlijke-Taalverwerking

Natuurlijke-Taalverwerking Natuurlijke-Taalverwerking Week 5 Parsing Overzicht DCG s en links-recursie Shift-reduce parsing Chart parsing Generatie Links-recursie?- voorouder(geert,youri). ouder(geert,jan). ouder(jan,youri). voorouder(x,y)

Nadere informatie

Natuurlijke-Taalverwerking I Shift-reduce Parsing

Natuurlijke-Taalverwerking I Shift-reduce Parsing Natuurlijke-Taalverwerkig I hift-reduce Parsig Gosse Bouma e Geert Kloosterma 2e semester 2005/2006, week 4 Meer da cotext-vrij, DCG s e liks-recursie, Bottom-up parsig, hift-reduce algoritme. Overzicht

Nadere informatie

Natuurlijke-Taalverwerking I Definite Clause Grammar deel 1

Natuurlijke-Taalverwerking I Definite Clause Grammar deel 1 1 atuurlijke-taalverwerking I Definite Clause Grammar deel 1 Gosse Bouma en Geert Kloosterman 2e semester 2005/2006 Overzicht CFG in Prolog, DCG-notatie, Prolog-termen i.p.v. categorieën, Lexicon en grammatica

Nadere informatie

Natuurlijke-taalverwerking

Natuurlijke-taalverwerking Natuurlijke-taalverwerking Parse disambiguatie Week 6 Overzicht Probabilistische CFG Parsen met PCFG Afleiden van PCFG uit treebank Evaluatie Disambiguatie voor unificatiegrammatica s Disambiguatie Ambiguïteit:

Nadere informatie

Natuurlijke-Taalverwerking I

Natuurlijke-Taalverwerking I 1 atuurlijke-taalverwerking I Gosse Bouma en Geert Kloosterman (pract) 2e semester 2005/2006 Overzicht Week1 : Inleiding, Context-vrije grammatica. Week 2-3 : Definite Clause Grammar Regels, gebruik van

Nadere informatie

Inleiding: Combinaties

Inleiding: Combinaties Zinnen 1 Inleiding: Combinaties Combinaties op verschillende niveaus: Lettergrepen als combinaties van fonemen. Woorden als combinaties van morfemen. Zinnen als combinaties van woorden en woordgroepen.

Nadere informatie

Natuurlijke-taalverwerking. Week 2

Natuurlijke-taalverwerking. Week 2 Natuurlijke-taalverwerking Week 2 Overzicht Context-vrije Grammatica s CFGs in Prolog Definite Clause Grammars (DCGs) Construeren van bomen Recapitulatie Doel: computers taal laten begrijpen Noodzaak:

Nadere informatie

Natuurlijke-Taalverwerking 1

Natuurlijke-Taalverwerking 1 Natuurlijke-Taalverwerking 1 Week 3 Definite Clause Grammar (vervolg) Overzicht 1 DCG Hoofdzinnen en bijzinnen Betekenis Generatie Automatisch Vertalen Meer dan context-vrije grammatica Een toepassing

Nadere informatie

Taal- en Spraaktechnologie Ambiguïteit

Taal- en Spraaktechnologie Ambiguïteit 2 Taal- en Spraaktechnologie Ambiguïteit Gosse Bouma 2004/2005 Zinnen zijn soms ambigu Die nacht is Marie bevallen. Hij kocht het huis op de markt. De man, die de hulpverlener heeft gered,... Ik kondig

Nadere informatie

Zoeken in een Afrikaans corpus: baie maklik! Liesbeth Augustinus Ineke Schuurman Vincent Vandeghinste Peter Dirix Frank Van Eynde

Zoeken in een Afrikaans corpus: baie maklik! Liesbeth Augustinus Ineke Schuurman Vincent Vandeghinste Peter Dirix Frank Van Eynde Zoeken in een Afrikaans corpus: baie maklik! Liesbeth Augustinus Ineke Schuurman Vincent Vandeghinste Peter Dirix Frank Van Eynde Colloquium Afrikaans - 23 oktober 2015 AFRIBOOMS PROJECT Syntactisch geannoteerd

Nadere informatie

De ontleding van het Corpus Gesproken Nederlands

De ontleding van het Corpus Gesproken Nederlands De ontleding van het Corpus Gesproken Nederlands Ton van der Wouden en Heleen Hoekstra Een corpus, in de zin van een verzameling tekst, bij elkaar brengen is tegenwoordig geen kunst meer. Met een computer

Nadere informatie

Syllabus Natuurlijke-Taalverwerking I. Gosse Bouma Afdeling Informatiekunde Rijksuniversiteit Groningen

Syllabus Natuurlijke-Taalverwerking I. Gosse Bouma Afdeling Informatiekunde Rijksuniversiteit Groningen Syllabus Natuurlijke-Taalverwerking I Gosse Bouma Afdeling Informatiekunde Rijksuniversiteit Groningen gosse@let.rug.nl Februari, 2006 Inhoudsopgave 1 Inleiding 4 1.1 Taal en computer.................................

Nadere informatie

Inhoudsopgave. Syllabus Natuurlijke-Taalverwerking I. Gosse Bouma Afdeling Informatiekunde Rijksuniversiteit Groningen

Inhoudsopgave. Syllabus Natuurlijke-Taalverwerking I. Gosse Bouma Afdeling Informatiekunde Rijksuniversiteit Groningen Syllabus Natuurlijke-Taalverwerking I Gosse Bouma Afdeling Informatiekunde Rijksuniversiteit Groningen gosse@let.rug.nl Februari, 2006 Inhoudsopgave 1 Inleiding 4 1.1 Taal en computer.................................

Nadere informatie

Natuurlijke-taalverwerking 1. Daniël de Kok

Natuurlijke-taalverwerking 1. Daniël de Kok Natuurlijke-taalverwerking 1 Daniël de Kok Natuurlijke-Taalverwerking Het college Natuurlijke-taalverwerking is een inleiding in de computationele taalkunde en maakt deel uit van het curriculum van Informatiekunde

Nadere informatie

Natuurlijke-Taalverwerking I Definite Clause Grammar 2

Natuurlijke-Taalverwerking I Definite Clause Grammar 2 Natuurlijke-Taalverwerking I Definite Clause Grammar 2 Gosse Bouma en Geert Kloosterman 2e semester 2005/2006, week 3 Overzicht Hoofdzinnen en bijzinnen DCG s en append Betekenis Generatie Automatisch

Nadere informatie

Inhoudsopgave. Syllabus Natuurlijke-Taalverwerking I. Gosse Bouma Afdeling Informatiekunde Rijksuniversiteit Groningen

Inhoudsopgave. Syllabus Natuurlijke-Taalverwerking I. Gosse Bouma Afdeling Informatiekunde Rijksuniversiteit Groningen Syllabus Natuurlijke-Taalverwerking I Gosse Bouma Afdeling Informatiekunde Rijksuniversiteit Groningen gosse@let.rug.nl Februari, 2006 Enkele aanpassingen door Gertjan van Noord (februari 2008) Inhoudsopgave

Nadere informatie

Huiswerk 3: Prolog. Inleiding Taalkunde. Dinsdag 31 mei

Huiswerk 3: Prolog. Inleiding Taalkunde. Dinsdag 31 mei Huiswerk 3: Prolog Inleiding Taalkunde Dinsdag 31 mei Opdracht 1: Top-down Parsing In deze opdracht bekijken we top-down parsing. Voor dit parseeralgoritme is een implementatie in Prolog gegeven in het

Nadere informatie

Zinnen 1. Henriëtte de Swart

Zinnen 1. Henriëtte de Swart Zinnen 1 Henriëtte de Swart Combinaties Taal maakt combinaties op verschillende niveaus: Fonemen combineren tot morfemen (creëren van betekenis) Morfemen combineren tot woorden (complexe betekenissen)

Nadere informatie

Modelleren en Programmeren: Prolog

Modelleren en Programmeren: Prolog Modelleren en Programmeren: Prolog Marijn Schraagen 15 januari 2016 Herhaling Definite Clause Grammars DCG s met argumenten DCG s met returnwaardes Herhaling Lijsten Een lijst is een sequentie van termen

Nadere informatie

Natuurlijke-Taalverwerking I Definite Clause Grammar 2

Natuurlijke-Taalverwerking I Definite Clause Grammar 2 Natuurlijke-Taalverwerking I Definite Clause Grammar 2 Gosse Bouma en Geert Kloosterman 2e semester 2005/2006, week 3 Hoofdzinnen en bijzinnen DCG s en append Betekenis Generatie Automatisch Vertalen Overzicht

Nadere informatie

Combinaties. Stof bij dit college

Combinaties. Stof bij dit college Combinaties Taal maakt combinaties op verschillende niveaus: Fonemen combineren tot morfemen (creëren van betekenis) Morfemen combineren tot woorden (complexe betekenissen) Woorden combineren tot woordgroepen,

Nadere informatie

AI Kaleidoscoop. College 9: Natuurlijke taal. Natuurlijke taal: het probleem. Fases in de analyse van natuurlijke taal.

AI Kaleidoscoop. College 9: Natuurlijke taal. Natuurlijke taal: het probleem. Fases in de analyse van natuurlijke taal. AI Kaleidoscoop College 9: atuurlijke taal Het Probleem Grammatica s Transitie netwerken Leeswijzer: Hoofdstuk 14.0-14.3 AI9 1 atuurlijke taal: het probleem Communiceren met computers als met mensen, middels

Nadere informatie

Informatiekunde in Groningen

Informatiekunde in Groningen kunde in John Alfa-informatica Rijksuniversiteit Huus van de Taol 3 juni 2009 Technologie voor taal kunde Studie waar computer centraal staat: Programmeren, ontwerpen, analyseren van ICT producten Gericht

Nadere informatie

Finite-state pre-processing for natural language analysis Prins, Robbert

Finite-state pre-processing for natural language analysis Prins, Robbert Finite-state pre-processing for natural language analysis Prins, Robbert IMPORTANT NOTE: You are advised to consult the publisher's version (publisher's PDF) if you wish to cite from it. Please check the

Nadere informatie

Er zijn alle soorten modificaties hoe je deze FST beter kan maken. Bijvoorbeeld, door - teen van thirteen - nineteen in het algemeen te lezen.

Er zijn alle soorten modificaties hoe je deze FST beter kan maken. Bijvoorbeeld, door - teen van thirteen - nineteen in het algemeen te lezen. 3. FST Het antwoord is: Er zijn alle soorten modificaties hoe je deze FST beter kan maken. Bijvoorbeeld, door - teen van thirteen - nineteen in het algemeen te lezen. Het idee is duidelijk hoop ik: voor

Nadere informatie

De klasse van recursief opsombare talen is gesloten onder en. Dit bewijzen we met behulp van een recursieve opsomming

De klasse van recursief opsombare talen is gesloten onder en. Dit bewijzen we met behulp van een recursieve opsomming Recursieve talen De klasse van recursief opsombare talen is gesloten onder en. Echter, het is niet zo dat L recursief opsombaar is voor alle recursief opsombare talen L. Dit bewijzen we met behulp van

Nadere informatie

Een hele eenvoudige benadering van de oplossing van dit probleem die men wel voorgesteld heeft, is de volgende regel:

Een hele eenvoudige benadering van de oplossing van dit probleem die men wel voorgesteld heeft, is de volgende regel: Accent op voorzetsels en partikels Het tweede probleem dat ik wil gebruiken ter illustratie is een probleem dat meer van belang is voor de spraaktechnologie. Een van de technologieën die spraaktechnologen

Nadere informatie

Recursion. Introductie 37. Leerkern 37. Terugkoppeling 40. Uitwerking van de opgaven 40

Recursion. Introductie 37. Leerkern 37. Terugkoppeling 40. Uitwerking van de opgaven 40 Recursion Introductie 37 Leerkern 37 5.1 Foundations of recursion 37 5.2 Recursive analysis 37 5.3 Applications of recursion 38 Terugkoppeling 40 Uitwerking van de opgaven 40 Hoofdstuk 5 Recursion I N

Nadere informatie

Overzicht. Question Answering en Informatie Extractie. Joost: a QA system for Dutch. Question Answering

Overzicht. Question Answering en Informatie Extractie. Joost: a QA system for Dutch. Question Answering Overzicht Question Answering en Informatie Extractie Gosse Bouma Information Science University of Groningen Natuurlijke Taalverwerking II, 2006/2007 Question Answering Technieken Question Analysis Answer

Nadere informatie

Naam: Mijn doelenboekje. Grammatica. Werelden - Eilanden - Dorpen 5 / 6 / 7 / 8.

Naam: Mijn doelenboekje. Grammatica. Werelden - Eilanden - Dorpen 5 / 6 / 7 / 8. Naam: Mijn doelenboekje Grammatica Werelden - Eilanden - Dorpen 5 / 6 / 7 / 8 www.gynzy.com Inhoud & Legenda In dit doelenboekje zijn de volgende Werelden te vinden: Taalkundige ontleding...3 Redekundige

Nadere informatie

Data-driven identification of fixed expressions and their modifiability Villada Moirón, María Begoña

Data-driven identification of fixed expressions and their modifiability Villada Moirón, María Begoña University of Groningen Data-driven identification of fixed expressions and their modifiability Villada Moirón, María Begoña IMPORTANT NOTE: You are advised to consult the publisher's version (publisher's

Nadere informatie

DOELGROEP Grammatica 3F is bedoeld voor leerlingen van havo/vwo en mbo 4. Het programma is geschikt voor zowel allochtone als autochtone leerlingen.

DOELGROEP Grammatica 3F is bedoeld voor leerlingen van havo/vwo en mbo 4. Het programma is geschikt voor zowel allochtone als autochtone leerlingen. DOELGROEP Grammatica 3F is bedoeld voor leerlingen van havo/vwo en mbo 4. Het programma is geschikt voor zowel allochtone als autochtone leerlingen. STRUCTUUR De lesstof is ingedeeld in rubrieken (onderwerpen)

Nadere informatie

(werkwoordelijk gezegde)

(werkwoordelijk gezegde) Grammatica 1F Grammatica 1F bestrijkt de basisregels van de Nederlandse grammatica die op de basisschool worden aangeleerd en waarmee in het voortgezet onderwijs meestal nog wordt geoefend. Doelgroepen

Nadere informatie

Grammatica 2F. Doelgroepen Grammatica 2F. Omschrijving Grammatica 2F. meewerkend voorwerp. voegwoord alle woordsoorten

Grammatica 2F. Doelgroepen Grammatica 2F. Omschrijving Grammatica 2F. meewerkend voorwerp. voegwoord alle woordsoorten Grammatica 2F Grammatica 2F bestrijkt de basisregels van de Nederlandse grammatica die op de basisschool worden aangeleerd en waarmee in het voortgezet onderwijs meestal nog wordt geoefend. Doelgroepen

Nadere informatie

Studentnummer: Inleiding Taalkunde 2013 Eindtoets Zet op ieder vel je naam en studentnummer!

Studentnummer: Inleiding Taalkunde 2013 Eindtoets Zet op ieder vel je naam en studentnummer! Inleiding Taalkunde 2013 Eindtoets Zet op ieder vel je naam en studentnummer! Dit tentamen bestaat uit 7 vragen. Lees elke vraag goed, en gebruik steeds de witte ruimte op de pagina, of de achterkant van

Nadere informatie

Inleiding. Syntaxis: de combinaties van woorden tot woordgroepen en zinnen.

Inleiding. Syntaxis: de combinaties van woorden tot woordgroepen en zinnen. Zinnen 2 Inleiding Syntaxis: de combinaties van woorden tot woordgroepen en zinnen. Wat voor rol spelen de kenmerken van de woorden hierbij? Wat voor soort woordvolgordes vinden we? Hoe kunnen die woordvolgordes

Nadere informatie

LogEX: gebruikershandleiding

LogEX: gebruikershandleiding LogEX: gebruikershandleiding ALGEMENE BESCHRIJVING Met de LogEX-applicatie kunt u drie soorten opgaven oefenen: het herschrijven van een logische expressie naar de disjunctieve normaalvorm In elke volgende

Nadere informatie

Samenvatting De belangrijkste onderzoeksvraag waarop het werk in dit proefschrift een antwoord probeert te vinden, is welke typen taalkundige informatie het nuttigst zijn voor de lexicale desambiguatie

Nadere informatie

Focus Particles inside PPs: A comparison between Dutch, English, and German

Focus Particles inside PPs: A comparison between Dutch, English, and German 2 Focus Particles inside PPs: A comparison between Dutch, English, and German Gosse Bouma, Petra Hendriks, and Jack Hoeksema April 2005 Focus Particles Kim only listens to JAZZ Kim only LISTENS to jazz

Nadere informatie

1e Deeltentamen Inleiding Taalkunde

1e Deeltentamen Inleiding Taalkunde 1e Deeltentamen Inleiding Taalkunde 28/05/2009 13.15-16.15 Dit tentamen heeft 5 vragen. Je hebt drie uur de tijd om deze te beantwoorden. Vergeet niet je naam en studentnummer steeds duidelijk te vermelden.

Nadere informatie

start -> id (k (f c s) (g s c)) -> k (f c s) (g s c) -> f c s -> s c

start -> id (k (f c s) (g s c)) -> k (f c s) (g s c) -> f c s -> s c Een Minimaal Formalisme om te Programmeren We hebben gezien dat Turing machines beschouwd kunnen worden als universele computers. D.w.z. dat iedere berekening met natuurlijke getallen die met een computer

Nadere informatie

Inleiding Programmeren 2

Inleiding Programmeren 2 Inleiding Programmeren 2 Gertjan van Noord November 26, 2018 Stof week 3 nogmaals Zelle hoofdstuk 8 en recursie Brookshear hoofdstuk 5: Algoritmes Datastructuren: tuples Een geheel andere manier om te

Nadere informatie

LTX016B05. Nieuwe ontwikkelingen in de syntaxis. College 4

LTX016B05. Nieuwe ontwikkelingen in de syntaxis. College 4 LTX016B05 Nieuwe ontwikkelingen in de syntaxis College 4 2/111 Vandaag: eerste college Regeer- en Bindtheorie (1/6) 3/111 Vandaag:! inhoudelijk gedeelte (een paar onderdelen van de theorie)! theoretisch

Nadere informatie

Extra opdrachten met het zinsbouwpakket. Bijlage bij het Basisboek syntaxis

Extra opdrachten met het zinsbouwpakket. Bijlage bij het Basisboek syntaxis Extra opdrachten met het zinsbouwpakket Bijlage bij het Basisboek syntaxis 1 Hoofdstuk 1: 1. De volgende opdrachten kun je alleen uitvoeren als je het zinsbouwpakket hebt. a. Zoek het puzzelstukje 'wolf'

Nadere informatie

Topics in Corpus-Based Dutch Syntax Beek, Leonoor Johanneke van der

Topics in Corpus-Based Dutch Syntax Beek, Leonoor Johanneke van der Topics in Corpus-Based Dutch Syntax Beek, Leonoor Johanneke van der IMPORTANT NOTE: You are advised to consult the publisher's version (publisher's PDF) if you wish to cite from it. Please check the document

Nadere informatie

Formuleren voor gevorderden

Formuleren voor gevorderden Formuleren voor gevorderden Het programma Formuleren voor Gevorderden is gemaakt voor leerlingen in de bovenbouw van het voortgezet onderwijs en voor leerlingen in mbo en hbo voor wie vaardigheden op het

Nadere informatie

Formuleren voor gevorderden

Formuleren voor gevorderden Formuleren voor gevorderden Het Muiswerkprogramma Formuleren voor Gevorderden is gemaakt voor leerlingen in de bovenbouw van het voortgezet onderwijs en voor leerlingen in mbo en hbo voor wie vaardigheden

Nadere informatie

Inconsistenties in dependency treebanks

Inconsistenties in dependency treebanks Inconsistenties in dependency treebanks Masterscriptie Jasper Hoenderken S0947032 Begeleider: Gertjan van Noord Tweede lezer: Gosse Bouma Rijksuniversiteit Groningen Juli 2009 Inhoudsopgave 1 Introductie

Nadere informatie

Inleiding Programmeren 2

Inleiding Programmeren 2 Inleiding Programmeren 2 Gertjan van Noord November 28, 2016 Stof week 3 nogmaals Zelle hoofdstuk 8 en recursie Brookshear hoofdstuk 5: Algoritmes Datastructuren: tuples Een geheel andere manier om te

Nadere informatie

Doorzoeken van grafen. Algoritmiek

Doorzoeken van grafen. Algoritmiek Doorzoeken van grafen Algoritmiek Vandaag Methoden om door grafen te wandelen Depth First Search Breadth First Search Gerichte Acyclische Grafen en topologische sorteringen 2 Doolhof start eind 3 Depth

Nadere informatie

Divide & Conquer: Verdeel en Heers vervolg. Algoritmiek

Divide & Conquer: Verdeel en Heers vervolg. Algoritmiek Divide & Conquer: Verdeel en Heers vervolg Algoritmiek Algoritmische technieken Vorige keer: Divide and conquer techniek Aantal toepassingen van de techniek Analyse met Master theorem en substitutie Vandaag:

Nadere informatie

Automaten & Complexiteit (X )

Automaten & Complexiteit (X ) Automaten & Complexiteit (X 401049) Inleiding Jeroen Keiren j.j.a.keiren@vu.nl VU University Amsterdam Materiaal Peter Linz An Introduction to Formal Languages and Automata (5th edition) Jones and Bartlett

Nadere informatie

Complexiteit. Anna Chernilovskaya. Inleiding Taalkunde

Complexiteit. Anna Chernilovskaya. Inleiding Taalkunde Complexiteit Anna Chernilovskaya Inleiding Taalkunde Vandaag: Complexiteit Hoofdstuk 12, sectie 12.6: voorproefje op hoofdstuk 16 Hoofdstuk 14, sectie 14.10: complexiteit van parsing (achtergrondmateriaal,

Nadere informatie

Grammaticaboekje NL. Om een beeld te krijgen van de inhoud: De inhoudsopgave, een paar onderwerpen en de eerste bladzijde van de trefwoorden.

Grammaticaboekje NL. Om een beeld te krijgen van de inhoud: De inhoudsopgave, een paar onderwerpen en de eerste bladzijde van de trefwoorden. 9 789082 208306 van Om een beeld te krijgen van de inhoud: De inhoudsopgave, een paar onderwerpen en de eerste bladzijde van de trefwoorden. Opzoekboekje voor leerlingen in klas 1 tot en met 3 in de onderbouw

Nadere informatie

Inleveropdracht 1: Morfologie & Syntaxis

Inleveropdracht 1: Morfologie & Syntaxis Inleveropdracht 1: Morfologie & Syntaxis Inleiding Taalkunde 2013 Lever de uitwerking van deze opgaves op papier in tijdens college of in het cursuspostvak op Trans 10, kamer 0.16b (dat is de kamer direct

Nadere informatie

Formuleren voor gevorderden

Formuleren voor gevorderden Formuleren voor gevorderden Het Muiswerkprogramma Formuleren voor Gevorderden is gemaakt voor leerlingen in de bovenbouw van het voortgezet onderwijs en voor leerlingen in mbo en hbo voor wie vaardigheden

Nadere informatie

De bovenkamer. Het gebruik van De bovenkamer bij Taal actief. Josée Coenen. een kleurrijke grammatica van het Nederlands

De bovenkamer. Het gebruik van De bovenkamer bij Taal actief. Josée Coenen. een kleurrijke grammatica van het Nederlands Josée Coenen De bovenkamer een kleurrijke grammatica van het Nederlands Het gebruik van De bovenkamer bij Taal actief Bij de verschillende onderdelen van Taal actief kunt u onderdelen uit De bovenkamer

Nadere informatie

Question Answering. College Natuurlijke Taalinterfaces. Januari 2002

Question Answering. College Natuurlijke Taalinterfaces. Januari 2002 Question Answering College Natuurlijke Taalinterfaces Januari 2002 1 Information Retrieval, Web Search Zoek relevante documenten over een bepaald onderwerp. Vraag: keywords (en boolese connectieven), Bin

Nadere informatie

Copyright 2010 PCM Uitgevers B.V. All Rights Reserved NRC Handelsblad. 23 oktober 2010 zaterdag

Copyright 2010 PCM Uitgevers B.V. All Rights Reserved NRC Handelsblad. 23 oktober 2010 zaterdag Copyright 2010 PCM Uitgevers B.V. All Rights Reserved NRC Handelsblad 23 oktober 2010 zaterdag SECTION: WETENSCHAP LENGTH: 2624 woorden HEADLINE: Taal zonder Droste effect - BYLINE: Berthold van Maris

Nadere informatie

Taaltechnologie. Januari/februari Inhoud

Taaltechnologie. Januari/februari Inhoud Taaltechnologie Januari/februari 2002 1 Finite state............................................... 4 1.1 Deterministic finite state automata.................... 4 1.2 Non-deterministic finite state automata................

Nadere informatie

Datastructuren en Algoritmen

Datastructuren en Algoritmen Datastructuren en Algoritmen Tentamen Vrijdag 6 november 2015 13.30-16.30 Toelichting Bij dit tentamen mag je gebruik maken van een spiekbriefje van maximaal 2 kantjes. Verder mogen er geen hulpmiddelen

Nadere informatie

Grammars and automatic syntactic analysis

Grammars and automatic syntactic analysis Grammars and automatic syntactic analysis Begoña Villada and Gosse Bouma May 9, 2003 Road map 1 NLP applications require syntactic analysis What is parsing? Sentences and constituent structure Grammars

Nadere informatie

1 WOORDSOORTEN 3 2 ZINSDELEN 8

1 WOORDSOORTEN 3 2 ZINSDELEN 8 Deel 1 Grammatica 1 1 WOORDSOORTEN 3 1.1 Tot welke woordsoort behoren de onderstreepte woorden in de volgende zinnen? 3 1.2 Multiple choice. Benoem de onderstreepte woorden 4 1.3 Benoem de onderstreepte

Nadere informatie

Modelleren en Programmeren: Prolog

Modelleren en Programmeren: Prolog Modelleren en Programmeren: Prolog Marijn Schraagen 20 januari 2016 Herhaling Gebruik negatie, assert Uitbreidingen DCG s Niet-natuurlijke talen Tentamenvoorbereiding Practicum: ingebouwde predicaten In

Nadere informatie

Off-line answer extraction for Question Answering Mur, Jori

Off-line answer extraction for Question Answering Mur, Jori Off-line answer extraction for Question Answering Mur, Jori IMPORTANT NOTE: You are advised to consult the publisher's version (publisher's PDF) if you wish to cite from it. Please check the document version

Nadere informatie

Examen Datastructuren en Algoritmen II

Examen Datastructuren en Algoritmen II Tweede bachelor Informatica Academiejaar 2016 2017, eerste zittijd Examen Datastructuren en Algoritmen II Naam :.............................................................................. Lees de hele

Nadere informatie

Opdrachten Werkcollege 4

Opdrachten Werkcollege 4 1. Vertaling in predicatenlogica Opdrachten Werkcollege 4 Vertaal de volgende zinnen naar de eerste orde predicatenlogica: Jan of Piet studeert wiskunde Moskou is een stad in Rusland Geen student die 5

Nadere informatie

Betekenis 2: lambda-abstractie

Betekenis 2: lambda-abstractie Betekenis 2: lambda-abstractie Anna Chernilovskaya 4 June 2009 Wat? Vorige keer: Predicaatlogica Vertaling van zinnen Deze keer: Predicaatlogica uitbreiding Vertaling van zinnen in details Overzicht van

Nadere informatie

Samenvatting. wh-vraagzinnen genoemd, omdat in het Engels dergelijke vraagwoorden met de letters wh beginnen.

Samenvatting. wh-vraagzinnen genoemd, omdat in het Engels dergelijke vraagwoorden met de letters wh beginnen. Samenvatting Talen verschillen in de wijze waarop woorden en zinnen of delen daarvan gecombineerd worden om een betekenisvolle expressie te vormen. Bijvoorbeeld, in de Engelse wh-vraagzin Who does John

Nadere informatie

De automatische analyse van subjectiviteit en causale samenhang in tekst

De automatische analyse van subjectiviteit en causale samenhang in tekst De automatische analyse van subjectiviteit en causale samenhang in tekst Wilbert Spooren Met dank aan: Erwin Komen, Micha Hulsbosch, Iris Hofstra, Patrick Sonsma Jet Hoek, Ted Sanders Clariah Subjectiviteit

Nadere informatie

Ontleden. Er zijn twee manieren van ontleden: taalkundig ontleden en redekundig ontleden.

Ontleden. Er zijn twee manieren van ontleden: taalkundig ontleden en redekundig ontleden. Ontleden Er zijn twee manieren van ontleden: taalkundig ontleden en redekundig ontleden. Bij het redekundig ontleden verdeel je de zin in zinsdelen en geef je elk zinsdeel een redekundige naam. Deze zinsdelen

Nadere informatie

Taalkunde en Computertaalkunde in de Lage Landen: een verhouding die eerst spannend was, dan gespannen en nu gewoon ontspannen

Taalkunde en Computertaalkunde in de Lage Landen: een verhouding die eerst spannend was, dan gespannen en nu gewoon ontspannen Taalkunde en Computertaalkunde in de Lage Landen: een verhouding die eerst spannend was, dan gespannen en nu gewoon ontspannen Frank Van Eynde Centrum voor Computerlinguïstiek KULeuven CLIN 25, Antwerpen,

Nadere informatie

Tentamen Discrete Wiskunde 1 10 april 2012, 14:00 17:00 uur

Tentamen Discrete Wiskunde 1 10 april 2012, 14:00 17:00 uur Tentamen Discrete Wiskunde 0 april 0, :00 7:00 uur Schrijf je naam op ieder blad dat je inlevert. Onderbouw je antwoorden, met een goede argumentatie zijn ook punten te verdienen. Veel succes! Opgave.

Nadere informatie

Zinnen 2. Inleiding. Inleiding. Kenmerken. Syntaxis: de combinaties van woorden tot woordgroepen en zinnen. Kenmerken (Features)

Zinnen 2. Inleiding. Inleiding. Kenmerken. Syntaxis: de combinaties van woorden tot woordgroepen en zinnen. Kenmerken (Features) Inleiding Zinnen 2 Syntaxis: de combinaties van woorden tot woordgroepen en zinnen. Wat voor rol spelen de kenmerken van de woorden hierbij? Wat voor soort woordvolgordes vinden we? Hoe kunnen die woordvolgordes

Nadere informatie

Product Informatie Blad - Taaltoets

Product Informatie Blad - Taaltoets Product Informatie Blad - Taaltoets PIB150-2010-Taaltoets Context In opdracht van het Ministerie van Onderwijs, Cultuur en Wetenschap (OCW) heeft de Commissie Meijerink onderzoek gedaan naar wat leerlingen

Nadere informatie

Programma van Inhoud en Toetsing (PIT)

Programma van Inhoud en Toetsing (PIT) 2016-2017 Vak: Nederlands Klas: vmbo-tl 2 Onderdeel: Spelling 1 & 2 Digitale methode 1F Spelling: verdubbeling en verenkeling. 1F Spelling: vorming van het bijvoeglijk naamwoord. 1F Werkwoordspelling waarvan

Nadere informatie

Examen Datastructuren en Algoritmen II

Examen Datastructuren en Algoritmen II Tweede bachelor Informatica Academiejaar 2012 2013, eerste zittijd Examen Datastructuren en Algoritmen II Naam :.............................................................................. Lees de hele

Nadere informatie

De constituent die niet bestaat Over het antecedent van betrekkelijke bijzinnen

De constituent die niet bestaat Over het antecedent van betrekkelijke bijzinnen De constituent die niet bestaat Over het antecedent van betrekkelijke bijzinnen Mark de Vries In zijn voorwoord bij In verband met de zin schrijft Jan: Ik heb in dit boek [ ] geprobeerd de traditionele

Nadere informatie

LESSTOF. Basisgrammatica

LESSTOF. Basisgrammatica LESSTOF Basisgrammatica INHOUD INLEIDING... 3 BASISGRAMMATICA EN MEIJERINK... 4 DOELGROEP... 4 STRUCTUUR... 5 OMVANG... 5 INHOUD... 7 Lesstof Basisgrammatica 2 INLEIDING Muiswerkprogramma s zijn computerprogramma

Nadere informatie

Het Muiswerkprogramma Grammatica op maat bestrijkt de grammatica die nodig is voor het leren van de Nederlandse spelling en zinsbouw.

Het Muiswerkprogramma Grammatica op maat bestrijkt de grammatica die nodig is voor het leren van de Nederlandse spelling en zinsbouw. Grammatica op maat Het Muiswerkprogramma Grammatica op maat bestrijkt de grammatica die nodig is voor het leren van de Nederlandse spelling en zinsbouw. Doelgroepen Grammatica op maat Dit programma is

Nadere informatie

Examen Datastructuren en Algoritmen II

Examen Datastructuren en Algoritmen II Tweede bachelor Informatica Academiejaar 2012 2013, tweede zittijd Examen Datastructuren en Algoritmen II Naam :.............................................................................. Lees de hele

Nadere informatie

College 4: Gegeneraliseerde Kwantoren

College 4: Gegeneraliseerde Kwantoren Semantiek CKI/CAI Utrecht, herfst 2008 College 4: Gegeneraliseerde Kwantoren Onderwerpen: NP denotaties als verzamelingen van verzamelingen, monotoniciteit bij kwantoren, determiner denotaties als relaties

Nadere informatie

Product Informatie Blad - Taaltoets

Product Informatie Blad - Taaltoets Product Informatie Blad - Taaltoets PIB150-2010-Taaltoets Context In opdracht van het Ministerie van Onderwijs, Cultuur en Wetenschap (OCW) heeft de Commissie Meijerink onderzoek gedaan naar wat leerlingen

Nadere informatie

De bovenkamer. Josée Coenen. een kleurrijke grammatica van het Nederlands. colofon

De bovenkamer. Josée Coenen. een kleurrijke grammatica van het Nederlands. colofon Josée Coenen De bovenkamer een kleurrijke grammatica van het Nederlands colofon Dit overzicht is samengesteld door Josée Coenen, auteur van De bovenkamer. Vormgeving Marjo Starink Bazalt 2016 Voor meer

Nadere informatie

Programma van Inhoud en Toetsing (PIT)

Programma van Inhoud en Toetsing (PIT) Onderdeel: Hoofdstuktoets [Je leert over] onderwerp, deelonderwerpen en hoofgedachte. 2F Ik kan onderwerp en deelonderwerpen van een tekst vinden. 2F Ik kan de hoofdgedachte van een tekst vinden. 2F Ik

Nadere informatie

Vierde college algoritmiek. 2 maart Toestand-actie-ruimte Exhaustive Search

Vierde college algoritmiek. 2 maart Toestand-actie-ruimte Exhaustive Search Algoritmiek 2018/Toestand-actie-ruimte Vierde college algoritmiek 2 maart 2018 Toestand-actie-ruimte Exhaustive Search 1 Algoritmiek 2018/Toestand-actie-ruimte Kannen Voorbeeld 4: Kannenprobleem We hebben

Nadere informatie

Programma van Inhoud en Toetsing (PIT)

Programma van Inhoud en Toetsing (PIT) Onderdeel: Grammatica zinsdelen H1-H3 (RTTI) Aantal lessen per week: 4 Hoofdstuk: 1-3 Extra materiaal: Nieuw Nederlands Online Cambiumned.nl De leerling kent de theorie m.b.t. de zinsdelen: - persoonsvorm

Nadere informatie

recursie Hoofdstuk 5 Studeeraanwijzingen De studielast van deze leereenheid bedraagt circa 6 uur. Terminologie

recursie Hoofdstuk 5 Studeeraanwijzingen De studielast van deze leereenheid bedraagt circa 6 uur. Terminologie Hoofdstuk 5 Recursion I N T R O D U C T I E Veel methoden die we op een datastructuur aan kunnen roepen, zullen op een recursieve wijze geïmplementeerd worden. Recursie is een techniek waarbij een vraagstuk

Nadere informatie

Examen Datastructuren en Algoritmen II

Examen Datastructuren en Algoritmen II Tweede bachelor Informatica Academiejaar 2008 2009, eerste zittijd Examen Datastructuren en Algoritmen II Naam :.............................................................................. Lees elke

Nadere informatie

LTX016B05. Nieuwe ontwikkelingen in de syntaxis. College 11

LTX016B05. Nieuwe ontwikkelingen in de syntaxis. College 11 LTX016B05 Nieuwe ontwikkelingen in de syntaxis College 11 2/68 Vandaag: tweede college Minimalisme (2/4) 3/68 Minimalisme! voortzetting van de generatieve syntaxis (1991-heden)! kernidee: de grammatica

Nadere informatie

1. Van taal naar taalwetenschap

1. Van taal naar taalwetenschap 1. Van taal naar taalwetenschap Opdracht 1.1 Vraag: Ga voor jezelf na hoe de verkleinwoorden van Nederlandse zelfstandige naamwoorden worden gevormd (dus: huis huisje, enzovoorts) en probeer zo de onbewuste,

Nadere informatie

Examen Datastructuren en Algoritmen II

Examen Datastructuren en Algoritmen II Tweede bachelor Informatica Academiejaar 2009 2010, eerste zittijd Examen Datastructuren en Algoritmen II Naam :.............................................................................. Lees de hele

Nadere informatie

In deze les. Eerste orde logica. Elementen van EOL. Waarom eerste orde logica? Combinatie met logica. Variabelen en Kwantoren

In deze les. Eerste orde logica. Elementen van EOL. Waarom eerste orde logica? Combinatie met logica. Variabelen en Kwantoren In deze les Eerste orde logica Bart de Boer Waarom EOL? Syntax en semantiek van EOL Opfrisser Gebruik van EOL EOL in de Wumpus-wereld Waarom eerste orde logica? Eerste orde logica kan alles uitdrukken

Nadere informatie

Containers stapelen. M.L. Koning april 2013

Containers stapelen. M.L. Koning april 2013 Technische Universiteit Eindhoven 2WH03 - Modelleren C Containers stapelen L. van Hees 0769244 M.L. Koning 0781346 2 april 2013 Y.W.A Meeuwenberg 0769217 1 Inleiding De NS vervoert dagelijks grote hoeveelheden

Nadere informatie

CPU scheduling : introductie

CPU scheduling : introductie CPU scheduling : introductie CPU scheduling nodig bij multiprogrammering doel: een zo hoog mogelijke CPU-bezetting, bij tevreden gebruikers proces bestaat uit afwisselend CPU-bursts en I/O-bursts lengte

Nadere informatie

Het minimale aantal sleutels op niveau h is derhalve

Het minimale aantal sleutels op niveau h is derhalve 1 (a) In een B-boom van orde m bevat de wortel minimaal 1 sleutel en maximaal m 1 sleutels De andere knopen bevatten minimaal m 1 sleutels en maximaal m 1 sleutels (b) In een B-boom van orde 5 bevat elke

Nadere informatie

Les 4: Les conversatie + grammatica Nederlands Conversatie Les 2 A-klas

Les 4: Les conversatie + grammatica Nederlands Conversatie Les 2 A-klas Les 4: Les conversatie + grammatica Nederlands Conversatie Les 2 A-klas Leraar: Dag Jef. Jef: Dag mevrouw. Hoe gaat het met u? Leraar: Goed, dank je. En met jou? Jef: Ook goed. ----------- Mark: Hallo

Nadere informatie

NLP technieken voor Question Answering

NLP technieken voor Question Answering NLP technieken voor Question Answering College Natuurlijke Taalinterfaces Januari 2003 1 Question Answering Vraag: Door wie werd WebTV Networks overgenomen? Antwoord is een (deel van een zin)uit een document:

Nadere informatie

CIM. Les 6. Het FFS controlesysteem

CIM. Les 6. Het FFS controlesysteem CIM Les 6 Het FFS controlesysteem Ontwerpfasen (gewoon weten dat er goed over nagedacht is) Referentiemodel algemene structuur taken relaties tussen taken bvb: ISO OSI / NBS (Amerikaans, slechts 6 lagen

Nadere informatie

zinsleer begrip van de syntaxis Jan-Wouter Zwart Understanding Syntax van Maggie Tallerman voor het Nederlands bewerkt en vermeerderd door

zinsleer begrip van de syntaxis Jan-Wouter Zwart Understanding Syntax van Maggie Tallerman voor het Nederlands bewerkt en vermeerderd door zinsleer begrip van de syntaxis Understanding Syntax van Maggie Tallerman voor het Nederlands bewerkt en vermeerderd door Jan-Wouter Zwart versie 2.1 Groningen, juli 2011 Voorbericht Deze syllabus bevat

Nadere informatie