Natuurlijke-Taalverwerking 1



Vergelijkbare documenten
Natuurlijke-Taalverwerking I Definite Clause Grammar 2

Natuurlijke-taalverwerking. Week 2

Modelleren en Programmeren: Prolog

Natuurlijke-taalverwerking 1. Daniël de Kok

Modelleren en Programmeren: Prolog

Natuurlijke-Taalverwerking I

Syllabus Natuurlijke-Taalverwerking I. Gosse Bouma Afdeling Informatiekunde Rijksuniversiteit Groningen

Inleiding: Combinaties

Studentnummer: Inleiding Taalkunde 2013 Eindtoets Zet op ieder vel je naam en studentnummer!

Inleveropdracht 1: Morfologie & Syntaxis

HANDLEIDING EUROGLOT TRANSLATOR MODULE

Samenvatting Nederlands Module 9

Inhoud Vijf lessen van elk tien zinnen over hoofd- en bijzinnen zoals die in het Nederlands kunnen voorkomen.

Samenvatting Nederlands Correct formuleren

HANDLEIDING EUROGLOT TRANSLATOR MODULE

DE SAMENGESTELDE ZIN ONDERWERPSZIN. ( Wie niet sterk is ),( moet ) [ slim ] { zijn }.

1e Deeltentamen Inleiding Taalkunde

Zinnen 1. Henriëtte de Swart

Opdrachten Werkcollege 4

Introductie tot de cursus

6.2. Boekverslag door C. 727 woorden 17 mei keer beoordeeld. Nederlands. Paragraaf 1. Dubbel op. Onjuiste herhaling

Samenvatting Nederlands formuleren

Naam: Mijn doelenboekje. Grammatica. Werelden - Eilanden - Dorpen 5 / 6 / 7 / 8.

(werkwoordelijk gezegde)

71 S. instapkaarten taal verkennen 5KM. MALtABERG. QVRre. v;rw>r t. -t.

Combinaties. Stof bij dit college

Toets grammaticale termen met sleutel

* Mijn vader vindt dat je aan make-up niet te veel geld aan moet uitgeven.

Het Muiswerkprogramma Basisgrammatica bestrijkt de grammatica die nodig is voor het leren van de Nederlandse spelling en zinsbouw.

Grammaticaboekje NL. Om een beeld te krijgen van de inhoud: De inhoudsopgave, een paar onderwerpen en de eerste bladzijde van de trefwoorden.

Index bij Möller, Hieratische Paläographie

Transfer en toegang tot Universele Grammatica in tweedetaalverwerving door volwassenen

HUSSELAAR HANDLEIDING

LESSTOF. Basisgrammatica

$% & ' & , -., /.., 0 )+ # ""1 2 # ""! 3 & &&- $# 4$"4# ""! & /

Het Muiswerkprogramma Grammatica op maat bestrijkt de grammatica die nodig is voor het leren van de Nederlandse spelling en zinsbouw.

OPA-methode. Inhoud. 1. De OPA-methode maakt uw zinnen leesbaar 2. Zinnen bestaan uit zinsdelen 3

Inleiding. Syntaxis: de combinaties van woorden tot woordgroepen en zinnen.

LTX016B05. Nieuwe ontwikkelingen in de syntaxis. College 7

Taaltechnologie. Januari/februari Inhoud

Informatiekunde in Groningen

CVO Tweedekansonderwijs Antwerpen NIVEAUBEPALING NEDERLANDS ASO 3

Eigen vaardigheid Taal

instapkaarten taal verkennen

Auditieve oefeningen bij het thema de dierentuin

LESSTOF. Basisgrammatica

Kennisrepresentatie & Redeneren. Piter Dykstra Instituut voor Informatica en Cognitie

Grammatica - Zinsontleden h3. CC Naamsvermelding 3.0 Nederland licentie.

Programma van Inhoud en Toetsing (PIT)

Recht op vrije meningsuiting

LTX016B05. Nieuwe ontwikkelingen in de syntaxis. College 13 (slot)

Zinnen 2. Inleiding. Inleiding. Kenmerken. Syntaxis: de combinaties van woorden tot woordgroepen en zinnen. Kenmerken (Features)

Betekenis 2: lambda-abstractie

Wat het Nederlands ons nog meer kan leren over de Jespersencyclus

Jan Heerze. Kortom. Nederlandse grammatica. Walvaboek

Ontleden. Er zijn twee manieren van ontleden: taalkundig ontleden en redekundig ontleden.

Z I N S O N T L E D I N G

1

Logica voor Informatica

Samenvatting. wh-vraagzinnen genoemd, omdat in het Engels dergelijke vraagwoorden met de letters wh beginnen.

Basisgrammatica. Doelgroep Basisgrammatica

Formuleren. Doelgroep Formuleren. Omschrijving Formuleren

Programma van Inhoud en Toetsing (PIT)

De klasse van recursief opsombare talen is gesloten onder en. Dit bewijzen we met behulp van een recursieve opsomming

Programma van Inhoud en Toetsing (PIT)

Formuleren voor gevorderden

Woordsoorten. Nederlands. Aanwijzend voornaamwoord. Onderschikkend voegwoord. Persoonlijk voornaamwoord. Betrekkelijk voornaamwoord

De ontleding van het Corpus Gesproken Nederlands

1 keer beoordeeld 4 maart 2018

Voorwoord 9 Gebruikte afkortingen 10 Overzicht van gebruikte grammaticale termen 11

Samenvatting Nederlands Grammatica Hoofdstuk 1 t/m 6

WHITEPAPER Sentiment Analyse

(6.3) a. Kim koopt altijd maar huizen. b. Kims altijd maar huizen kopen (begint mij te irriteren).(vgl. *Kims kopen altijd maar huizen...

Dinie Ea van Oort Verhaalland Taalleerlijn

Formuleren voor gevorderden

Formuleren voor gevorderden

3,7. Dubbelop: Tautologie: Pleonasme: Contaminatie: Samenvatting door een scholier 1713 woorden 8 juni keer beoordeeld.

Automaten & Complexiteit (X )

R.A.N. (Romy) van Drie BA Nederlandse Taal en Cultuur, Universiteit Utrecht, Utrecht, Nederland.

Transcriptie:

Natuurlijke-Taalverwerking 1 Week 3 Definite Clause Grammar (vervolg)

Overzicht 1 DCG Hoofdzinnen en bijzinnen Betekenis Generatie Automatisch Vertalen Meer dan context-vrije grammatica Een toepassing

DCG 2 Notatie voor grammatica regels Categorieën: Prolog termen Extra Prolog condities met {.. } Automatisch omgezet naar Prolog regels

DCG 3 s --> np(n), vp(n). det --> []. n --> [eieren]. s(p0,p2) :- np(n,p0,p1), vp(n,p1,p2). det(p0,p) :- P0 = P. n(p0,p) :- C (P0,eieren,P).

Prolog-lijsten als String-Posities 4 0 = [de,olifant,ontsnapt] 1 = [olifant,ontsnapt]... 3 = [ ] de olifant ontsnapt 0 de 1 olifant 2 ontsnapt 3 word([de,olifant,ontsnapt],de,[olifant,ontsnapt]). word([olifant,ontsnapt],olifant,[ontsnapt]). word([ontsnapt],ontsnapt,[]).

My first parser (mens) 5 parse(words) :- s(words,[]). s --> np, vp. np --> det, n. vp --> v. vp --> v, np. det --> [de]. det --> [het]. det --> []. n --> [man]. n --> [huis]. v --> [verlaat]. v --> [schreeuwt].

My first parser (computer) 6 parse(words) :- s(words,[]). C ([Word Words],Word,Words). %%... en verder de grammaticaregels: s(p0,p2) :- np(p0,p1), vp(p1,p2). np(p0,p3) :- det(p0,p1), n(p1,p2). vp(p0,p1) :- v(p0,p1). vp(p0,p2) :- v(p0,p1), np(p1,p2). det(p0,p1) :- C (P0,de,P1). det(p0,p1) :- C (P0,het,P1). det(p0,p0). n(p0,p1) :- C (P0,man,P1). n(p0,p1) :- C (P0,huis,P1). v(p0,p1) :- C (P0,verlaat,P1). v(p0,p1) :- C (P0,schreeuwt,P1).

Hoofdzinnen en bijzinnen 7 (1) a. de directeur voert de flamingo b. omdat de directeur de flamingo voert (2) a. de ijsbeer eet gulzig b. omdat de ijsbeer gulzig eet (3) a. de directeur voert de flamingo regelmatig b. omdat de directeur de flamingo regelmatig voert (4) a. de ijsbeer belt de flamingo soms op b. omdat de ijsbeer de flamingo soms op belt (5) a. de ijsbeer zou de flamingo willen eten b. omdat de ijsbeer de flamingo zou willen eten

Hoofdzinnen en bijzinnen 8 Een hoofdzin lijkt op een bijzin, afgezien van de positie van de persoonsvorm

Hoofdzinnen en bijzinnen 9 %% voert de flamingo vp --> v np %% eet gulzig vp --> v adv %% omdat de directeur de flamingo voert cp --> [omdat] np vpb %% de flamingo voert vpb --> np v %% gulzig eet vpb --> adv v

Hoofdzinnen en bijzinnen 10 (6) a. de directeur heeft de flamingo gevoerd b. dat de directeur de flamingo heeft gevoerd c. dat de directeur de flamingo gevoerd heeft

Hoofdzinnen en bijzinnen 11 %% heeft de flamingo gevoerd vp --> aux np prt %% de flamingo gevoerd heeft %% de flamingo heeft gevoerd vpb --> np vc %% heeft gevoerd vc --> aux prt %% gevoerd heeft vc --> prt aux %% voert vc --> v

Bijzinnen 12 CP Compl NP VP(fin) dat de directeur NP VP(fin) de flamingo VC(fin) Aux(fin) V(prt) heeft gevoerd

Hoofdzinnen 13 S NP Aux(fin) VP(no-aux) De directeur heeft NP VP(no-aux) de flamingo VC(no-aux) Aux(no-aux) V(prt) gevoerd

DCG 14 Argument om informatie over de persoonsvorm door te geven: s --> np, v(fin), vp(no_v). s --> np, aux(fin), vp(no_aux). cp --> compl, np, vp(fin). vp(v) --> np, vp(v). vp(v) --> adv, vp(v). vp(v) --> vc(v). vc(v) --> v(v). vc(v) --> aux(v), v(prt). vc(v) --> v(prt), aux(v). v(fin) --> [voert]. v(no_v) --> []. aux(fin) --> [heeft]. aux(no_aux) --> [].

DCG... 15 omdat de directeur de flamingo s wil voeren omdat de directeur de flamingo s wil hebben gevoerd omdat de directeur de flamingo s gevoerd wil hebben omdat de directeur de flamingo s zou willen hebben gevoerd omdat de directeur de flamingo s gevoerd zou willen hebben

Automatisch vertalen 16 Iedere student bezit een fiets x(student(x) y(bike(y) possess(x, y))) Every student owns a bike Bepaal de betekenis van de zin in de brontaal, Genereer een zin in de doeltaal met dezelfde betekenis.

Semantiek (Betekenis) 17 Betekenis van een zin is opgebouwd uit de betekenis van de zinsdelen, De betekenis van zinsdelen is opgebouwd uit de betekenis van de samenstellende delen (zinsdelen en/of woorden). Aan een DCG kan een argument worden toegevoegd dat de betekenis weergeeft.

Semantiek en DCG 18 tijd(uur(u,m)) --> uur(u), [uur], min(m). tijd(uur(u,m)) --> min(m), [over], uur(u). tijd(uur(u,m)) --> min(m), [minuten,over], uur(u). min(15) --> [vijftien]. min(15) --> [kwart]. uur(3) --> [drie].?- tijd(uur,[kwart,over,drie],[]). Uur = uur(3,15)

Semantiek en DCG 19?- s(sem,[ismail,spreekt,bahasa],[]). Sem = spreken(i,b) s(sem) --> np(sub), vp(sub,sem). vp(subj,sem) --> v(sub,obj,sem), np(obj). np(i) --> [ismail]. np(b) --> [bahasa]. v(subj,obj,spreken(subj,obj)) --> [spreekt].

Generatie 20 Parsing is het omzetten van zinnen in boomstructuren of betekenis, Generatie is het omzetten van betekenis in zinnen.

Generatie en DCG 21 Een DCG wordt een generator, wanneer de lijst woorden geheel of gedeeltelijk variabel is.?- s([a,b,c,d],[]).

Generatie van willekeurige zinnen 22?- s([a,b,c,d],[]), write([a,b,c,d]), nl, fail.... [de,partijbons,nadert,vandaag]... [een,neoliberale,boerendochter,ontsnapt]... [een,feestvarken,heeft,gesnurkt]

Generatie op basis van betekenis 23 tijd(uur(u,m)) --> uur(u), [uur], min(m). tijd(uur(u,m)) --> min(m), [over], uur(u). min(15) --> [vijftien]. min(15) --> [kwart]. uur(3) --> [drie].?- tijd(uur(3,15),words,[]). Words = [drie,uur,vijftien] ; Words = [vijftien,over,drie] ; Words = [kwart,over,drie] ;...

Automatisch vertalen 24 vertaal(nl,eng) :- tijd(semantiek,nl,[]), time(semantiek,eng,[]). time(uur(h,m)) --> hour(h), minute(m). time(uur(h,m)) --> minute(m), [past], hour(h).

Hoe krachtig is DCG? 25 Krachtiger dan CFG! Bewijs: Er zijn talen waarvoor geen CFG te geven valt, Maar waarvoor wel een DCG bestaat.

COPY-taal 28 WW: een willekeurige reeks a s en b s, gevolgd door dezelfde reeks.?- s(l,[a,a,b,a,a,b],[]). L = [a,a,b] s(l) w(l), w(l) w([a Rst]) --> [a], w(rst). w([b Rst]) --> [b], w(rst). w([]) --> [].

Nederlandse werkwoordsclusters 29 dat ik de olifanten voer dat ik Henk de olifanten help voeren dat ik Cecilia Henk de olifanten zie helpen voeren... NP n +1hoort bij werkwoord n, Dit patroon van kruisende afhankelijkheden vertoont gelijkenis met COPY-taal. Wordt gebruikt in bewijs dat natuurlijke taal niet context-vrij is (Huybregts 1984), met data uit het Züritüütsch.