Taalkundige verrijking in relatie tot PAROLE Corpus maar ook in ruimer kader
|
|
- Mark Visser
- 7 jaren geleden
- Aantal bezoeken:
Transcriptie
1 Taalkundige verrijking in relatie tot PAROLE Corpus maar ook in ruimer kader type verrijking: woordsoort en trefwoord/lemma syntactische, semantische verrijking doel: retrieval op verschillende niveau s: (woordvorm/type) woordsoort ( Part of Speech : POS ) trefwoord combinaties te maken keuzes: welk woordsoortenstelsel ( tagset ) welke representatie van de tagset welke methode van toepassen van de tagset
2 Principe: verrijking (annotatie) bepalend voor retrieval (1) Digitale tekst : zoek alle woorden (types) eindigend op -ig -> aardig, big, dienovereenkomstig, groenig, lig, nevelig, tuig, wig, Verrijkt met woordsoort : zoek alle adjectieven eindigend op -ig -> aardig, groenig, nevelig Verrijkt met trefwoord : zoek alle types van het trefwoord aardig -> aardig, aardige, aardiger, aardigst, aardigste
3 Principe: verrijking (annotatie) bepalend voor retrieval (2) Verrijkt (geannoteerd) tekstfragment ontleend aan een (oud) INLcorpus: trefwoord en uitsluitend hoofdwoordsoort Ondanks_v{ondanks} de_l{de} uitwijzing_z{uitwijzing} en_c{en} de_l{de} politieke_a{politiek} spanningen_z{spanning} die_p{die} ze_p{ze} tot_v{tot} gevolg_z{gevolg} hebben_w{hebben}, biedt_w{bieden} Rabins_a{Rabins#} premierschap_z{premierschap} de_l{de} Palestijnen_z{Palestijn} nog_b(nog) altijd_b{altijd} de_l{de} beste_a{best} kansen_z{kans} om_v{om} ETC.
4 Principe: verrijking (annotatie) bepalend voor retrieval (3) Verrijkt (geannoteerd) tekstfragment ontleend aan het zoeksysteem voor het PAROLE-corpus, met subcategorisatie (EAGLES)
5 Taalkundige verrijking te maken keuzes: welk woordsoortenstelsel ( tagset ) welke representatie van de tagset welke methode van toepassen van de tagset EAGLES/PAROLE: lettercodes op vaste posities: Rgp Internet-PAROLE: begrijpelijker notatie: ADV(type=general,degree=pos) kenmerk n.v.t.: NOU(type=comm,gender=fm,number=sg,constr=-)
6 Taalkundige verrijking te maken keuzes: welk woordsoortenstelsel ( tagset ) welke representatie van de tagset welke methode van toepassen van de tagset 2 mogelijkheden: functionele methode bijv. nw. als bijw. gebruikt: bijw Dat is een mooi gedrukte tekst mooi: bijw. transcategorisatie lexicale methode bijv. nw. in alle contexten: bijv.nw. Dat is een mooi gedrukte tekst mooi: bijv.nw.
7 Transcategorisatie: verandering van lexicale woordsoort Bij sommige mensen gaat hun hart sneller kloppen als het hen te druk is niet: ADJ(type=quali,degree=com,infl=basic,construct=-) maar: ADV(type=general,degree=com,construct=-) Vragen uit de praktijk van het taggen van een corpus: - Kan elke POS transcategoriseren naar een andere POS? - Indien niet: welke wel en welke niet? - Indien wel: naar welke POS kan een woord transcategoriseren en op basis van welke criteria?
8 Kan elke POS transcategoriseren naar een andere POS? Voorbeelden Kan een znw. transcategoriseren naar bijw.? znw. bijw.? eind deze week functie: bijw vergelijk: aan het eind van deze week znw. Kan een znw. transcategoriseren naar bijv. nw.? znw. bijv.nw.? hij is meer mens dan vis znw/bijv.nw? Kan een telw. transcategoriseren naar znw., bijv.nw., det.? hij is de zevende vandaag znw. hij is zevende geworden bijv.nw. hij is zes jaar bijv.nw.?/det.?? hij is nu zes telw./bijv.nw.?
9 Indien transcategorisatie toegestaan: naar welke POS kan een woord transcategoriseren en op basis van welke criteria? Voorbeelden Welk criterium bepalend voor functie als znw.: hoofd van NP of hoofd van NP + lidw./det.? hij is kandidaat bnw./znw? hij is onze kandidaat znw. Wat na íets : bijv.nw. of znw.? iets moois bijv.nw./znw.? Welke criterium bepalend voor functie als bijv.nw.? hij komt als geroepen / als advocaat bijv.nw.? hij is iemand/iets bijv.nw.?
10 Functionele methode in de PAROLE-praktijk (1) Nominalisaties : 1. bijv.nw. znw. wij zagen mooie en lelijke bloemen bijv.nw. wij zagen mooie bloemen en lelijke znw. 2. inf. ww. znw. ze gaan de schoorsteen afbreken ww. wat wij zien als het afbreken van rechten znw. 3. telw. znw. ik heb er drie telw. ik prefereer die drie van gisteren znw. ik kies voor de derde optie telw. de derde van links werkt beter znw.
11 Functionele methode in de PAROLE-praktijk (2) 4. det. poss. znw. ik zag jouw moeder det. geef me de jouwe! znw. Andere transcategorisaties: 5. bijv.nw. bijw. het boek is mooi bnw. de pianist speelt mooi bijw. 6. volt. deelw. ww. bnw. John heeft hard gewerkt Vpart de gewerkte uren bnw. ik tel die uren als gewerkt bnw.
12 Evaluatie wijzigingen in de tagset (1) vereenvoudigingen werkwoorden: main verb function (trans., intrans. onpers., reflexief): not applicable echte bijwoorden en pronominale bijwoorden: degree (pos., comp., superl.): not applicable geslacht zelfst. naamw.: reductie tot de en het not applicable in achternamen getalsymbolen: meervoud not applicable
13 Evaluatie wijzigingen in de tagset (2) toegevoegd, o.a. construction (sepvrb, sepadv) bij scheidbare werkwoorden en pronominale bijwoorden nieuwe types voor Residual: trunc, acronym, acro-proper, other
14 Woordsoorttoekenning in historisch Nederlands tagset en tagmethode in diachroon perspectief keuze tussen enkelvoudige versus meervoudige woordsoorttags aan elkaar geschreven woorden versus los geschreven woorddelen gebruik van de historische woordenboeken VMNW, MNW en WNT voor de woordsoort gebrek aan consensus onder linguïsten
15 Automatische taalkundige verrijking met POS en lemma (zie corpusdocumentatie PAROLE) trainingcorpus ( tokens) combinatie van statistische taggers selectieve handmatige correctie opnieuw taggen met door de correctie verbeterde combinatietagger regelgebaseerde correctie en verfijning (toevoeging van features) automatisch lemmatiseren m.b.v. lexicon evaluatie aanpassingen tagset en tagmethode waarschuwingen aan de gebruiker PAROLE-corpus
16 Literatuur Dutilh, T. & J.G. Kruyt (2002), Implementation and Evaluation of PAROLE PoS in a National Context. In: Proceedings of the Third International Conference on Language Resources & Evaluation, pp Ook op Decorte, S.F.T. (2003). Taalkundige verrijking in historische corpora in relatie tot de Geïntegreerde Taalbank. INL Working Papers Leiden : INL. Ook op Decorte, S.F.T., Dutilh-Ruitenberg, T. & Kruyt, T. (2005). Language change and linguistic annotation in the Integrated Language Database of 8th- to 21st-Century Dutch. In Pusch, C.D., Kabatek, J. & Raible, W. (eds.), Romanistische Korpuslingustik II: Korpora und diachrone Sprachwissenschaft. Tübingen : pp Ook op
17 Does, J. de, Voort van der Kleij, J. van der (2002). Tagging the Dutch PAROLE Corpus. In Theune, M. et al. (eds.), Computational Linguistics in the Netherlands 2001; Selected Papers from the Twelfth CLIN Meeting. Amsterdam - New York : Rodopi, pp Ook op Corpusdocumentatie bij PAROLE-corpussysteem
Wat is een corpus en waarvoor wordt het gebruikt?
Wat is een corpus en waarvoor wordt het gebruikt? Een corpus is een verzameling teksten of getranscribeerde geproken taal met een samenstelling en proportionering van teksttypen die geschikt is voor een
Nadere informatieMaken van een woordenboek:4 hoofdfasen
Maken van een woordenboek:4 hoofdfasen 1. het maken van een concept + het testen van het concept door middel van proefartikelen hoe moet je woordenboek er inhoudelijk uitzien? 2. opbouw van een materiaalverzameling
Nadere informatieWoordenboekencomponent van de Geïntegreerde Taalbank (GTB): het WNT en VMNW met andere databestanden geïntegreerd in 1 zoeksysteem demo gtb.inl.
Woordenboekencomponent van de Geïntegreerde Taalbank (GTB): het WNT en VMNW met andere databestanden geïntegreerd in 1 zoeksysteem demo gtb.inl.nl: basiszoeken en uitgebreid zoeken links vanuit een artikel
Nadere informatieRETRIEVALSYSTEMEN VOOR TAALKUNDIG ONDERZOEK Wat biedt het INL nu en in de toekomst? Instituut voor Nederlandse Lexicologie
RETRIEVALSYSTEMEN VOOR TAALKUNDIG ONDERZOEK Wat biedt het INL nu en in de toekomst? Instituut voor Nederlandse Lexicologie Postbus 9515, 2300 RA Leiden, Nederland www.inl.nl Overzicht van de presentatie
Nadere informatieHet World Wide Web als corpus
Het World Wide Web als corpus Typen gebruik van het WWW: - het downloaden van teksten of hun URLs - het doorzoeken van het web als gigantische en multilinguale tekstenverzameling - onderzoek naar kenmerken
Nadere informatieSamenvatting De belangrijkste onderzoeksvraag waarop het werk in dit proefschrift een antwoord probeert te vinden, is welke typen taalkundige informatie het nuttigst zijn voor de lexicale desambiguatie
Nadere informatieGrammaticaboekje NL. Om een beeld te krijgen van de inhoud: De inhoudsopgave, een paar onderwerpen en de eerste bladzijde van de trefwoorden.
9 789082 208306 van Om een beeld te krijgen van de inhoud: De inhoudsopgave, een paar onderwerpen en de eerste bladzijde van de trefwoorden. Opzoekboekje voor leerlingen in klas 1 tot en met 3 in de onderbouw
Nadere informatieEen hele eenvoudige benadering van de oplossing van dit probleem die men wel voorgesteld heeft, is de volgende regel:
Accent op voorzetsels en partikels Het tweede probleem dat ik wil gebruiken ter illustratie is een probleem dat meer van belang is voor de spraaktechnologie. Een van de technologieën die spraaktechnologen
Nadere informatieDe ontleding van het Corpus Gesproken Nederlands
De ontleding van het Corpus Gesproken Nederlands Ton van der Wouden en Heleen Hoekstra Een corpus, in de zin van een verzameling tekst, bij elkaar brengen is tegenwoordig geen kunst meer. Met een computer
Nadere informatiecurriculum vitae bart decadt November 2004
curriculum vitae bart decadt November 2004 mijn gegevens Datum en plaats van geboorte : 13 november 1977 Nationaliteit : Belg Beroep : onderzoeksassistent Burgerlijke stand : ongehuwd, samenwonend met
Nadere informatieDutch Parallel Corpus Multilinguaal & multifunctioneel. Lieve Macken Hogeschool Gent
Dutch Parallel Corpus Multilinguaal & multifunctioneel Lieve Macken Hogeschool Gent Dutch Parallel Corpus Parallel corpus Teksten + vertaling Gealigneerd op zinsniveau 10 miljoen woorden Nederlands Engels
Nadere informatiehandelingswijzer redekundig ontleden zinsdelen
handelingswijzer redekundig ontleden zinsdelen Naslagwerk Voor leerlingen en ouders INHOUD INHOUD... 2 REDEKUNDIGE ONTLEDING: ZINSDELEN... 3 PERSOONSVORM (pv)... 3 WERKWOORDELIJK GEZEGDE (ww gez)... 3
Nadere informatieLeerstofoverzicht Watenhoe-nt2 cursus drie
Leerstofoverzicht Watenhoent2 cursus drie cursus drie pragmatiek 1 taalfuncties 2 gesprekconventies 3 tekst begrijpen 4 tekst woordenschat inhoudswoorden per thema en aantal woordenschat functiewoorden
Nadere informatieNieuwe zoekfuncties SUBTLEX-NL
Nieuwe zoekfuncties SUBTLEX-NL SUBTLEX-NL is een databestand dat informatie verschaft over de frequentie van woorden in Nederlandse ondertitels. Uit ons onderzoek is gebleken dat dergelijke woordfrequenties
Nadere informatieLexicografie en lexicologie
Lexicografie en lexicologie Basisliteratuur: Piet van Sterkenburg (ed.) (2003), A Practical Guide to Lexicography. John Benjamins Publishing Company, Amsterdam/Philadelphia. + aanvullende literatuur op
Nadere informatieInhoud: de eerste verzameling van Nederlandstalige gesproken en geschreven teksten, 1960-1973
1 1 Nederlandstalige corpora 1.1 Eindhoven Corpus (EHC) of Corpus Uit den Boogaart Inhoud: de eerste verzameling van Nederlandstalige gesproken en geschreven teksten, 1960-1973 Omvang: geschreven taal:
Nadere informatieSentimentanalyse voor online politieke berichtgeving
1 Sentimentanalyse voor online politieke berichtgeving Tom De Smedt Doctoraatsstudent Kunsten Computational Linguistics Research Group Universiteit Antwerpen TAALKUNDE Experimental Media Research Group
Nadere informatieNatuurlijke-taalverwerking 1. Daniël de Kok
Natuurlijke-taalverwerking 1 Daniël de Kok Natuurlijke-Taalverwerking Het college Natuurlijke-taalverwerking is een inleiding in de computationele taalkunde en maakt deel uit van het curriculum van Informatiekunde
Nadere informatieCover Page. The handle holds various files of this Leiden University dissertation.
Cover Page The handle http://hdl.handle.net/1887/40632 holds various files of this Leiden University dissertation. Author: Meelen, M. Title: Why Jesus and Job spoke bad Welsh : the origin and distribution
Nadere informatie53. Anders ga je met pensioen!
53. Anders ga je met pensioen! Alex Reuneker, Universiteit Leiden 1 Het bijwoord anders kent volgens Smessaert en Van Belle (2010) drie typen gebruik, als in (1)-(3). (1) Ze zullen zich morgen anders gedragen
Nadere informatieZoeken in een Afrikaans corpus: baie maklik! Liesbeth Augustinus Ineke Schuurman Vincent Vandeghinste Peter Dirix Frank Van Eynde
Zoeken in een Afrikaans corpus: baie maklik! Liesbeth Augustinus Ineke Schuurman Vincent Vandeghinste Peter Dirix Frank Van Eynde Colloquium Afrikaans - 23 oktober 2015 AFRIBOOMS PROJECT Syntactisch geannoteerd
Nadere informatieNederlandse TaalUnie. Vertrouwelijk GridLine B.V., 2012 Pagina 1 van 52
Nederlandse TaalUnie Vertrouwelijk GridLine B.V., 2012 Pagina 1 van 52 Documenthistorie Datum Versie Beschrijving Auteur 07-03-2011 1.0 Initiële versie Dennis de Vries 09-05-2011 2.0 Uitbreidingen n.a.v.
Nadere informatieDutch Parallel Corpus Multilinguaal & multifunctioneel. Lieve Macken LT 3 Hogeschool Gent
Dutch Parallel Corpus Multilinguaal & multifunctioneel Lieve Macken LT 3 Hogeschool Gent Dutch Parallel Corpus Parallel corpus Teksten + vertaling Gealigneerd op zinsniveau 10 miljoen woorden Nederlands
Nadere informatieFinite-state pre-processing for natural language analysis Prins, Robbert
Finite-state pre-processing for natural language analysis Prins, Robbert IMPORTANT NOTE: You are advised to consult the publisher's version (publisher's PDF) if you wish to cite from it. Please check the
Nadere informatieHet sem metrix. metrix-project. De profielgebaseerde meting van lexicale. University of Leuven RU Quantitative Lexicology and Variational Linguistics
Het sem metrix metrix-project De profielgebaseerde meting van lexicale variatie op een grotere schaal Kris Heylen & Yves Peirsman University of Leuven RU Quantitative Lexicology and Variational Linguistics
Nadere informatieEnquête crowdsourcing knaw voor onderzoekers en collectiebeheerders
Bijlage 1: Enquête crowdsourcing knaw voor onderzoekers en collectiebeheerders Algemene informatie: 59 reacties in 4 weken Geachte collega s, Binnen de geesteswetenschappen van de knaw ontwikkelt een consortium
Nadere informatieFESLI. Gebruikershandleiding. Gebruikershandleiding bij de FESLI web applicatie CLARIN-NL
CLARIN-NL FESLI Gebruikershandleiding Gebruikershandleiding bij de FESLI web applicatie M e e r t e n s I n s t i t u u t, J o a n M u y s k e n s w e g 2 5, 1 0 9 6 C J A m s t e r d a m Gebruikershandleiding
Nadere informatieCOAVA. Gebruikershandleiding. Gebruikershandleiding bij de COAVA web applicatie CLARIN-NL
CLARIN-NL COAVA Gebruikershandleiding Gebruikershandleiding bij de COAVA web applicatie M e e r t e n s I n s t i t u u t, J o a n M u y s k e n s w e g 2 5, 1 0 9 6 C J A m s t e r d a m Gebruikershandleiding
Nadere informatieOver de Nederlandse spreektaal
TON VAN DER WOUDEN (DUITSLAND, MÜNSTER) Over de Nederlandse spreektaal Summary The paper discusses some phenomena of spoken Dutch from a Construction grammar point of view. Inleiding Schrijftaal is iets
Nadere informatieSemantische. Eindwerkstuk voor Information Retrieval Wybo Wiersma, s
Semantische Zwaartekracht Eindwerkstuk voor Information Retrieval Wybo Wiersma, s1298577 Wybo Wiersma Semantische Zwaartekracht 1 Inhoudsopgave Inleiding......2 Eerder werk......3 Window gebaseerde Information
Nadere informatieInleiding. Syntaxis: de combinaties van woorden tot woordgroepen en zinnen.
Zinnen 2 Inleiding Syntaxis: de combinaties van woorden tot woordgroepen en zinnen. Wat voor rol spelen de kenmerken van de woorden hierbij? Wat voor soort woordvolgordes vinden we? Hoe kunnen die woordvolgordes
Nadere informatieDe bovenkamer. Het gebruik van De bovenkamer bij Taal actief. Josée Coenen. een kleurrijke grammatica van het Nederlands
Josée Coenen De bovenkamer een kleurrijke grammatica van het Nederlands Het gebruik van De bovenkamer bij Taal actief Bij de verschillende onderdelen van Taal actief kunt u onderdelen uit De bovenkamer
Nadere informatieVerkenning van semasiologische variatie in verkeerstermen in het Nederlands
Verkenning van semasiologische variatie in verkeerstermen in het Nederlands Jocelyne Daems KU Leuven OG Quantitative Lexicology and Variational Linguistics Overzicht Achtergrond Data Methodologie Resultaten
Nadere informatieInleiding: Combinaties
Zinnen 1 Inleiding: Combinaties Combinaties op verschillende niveaus: Lettergrepen als combinaties van fonemen. Woorden als combinaties van morfemen. Zinnen als combinaties van woorden en woordgroepen.
Nadere informatiehandelingswijzer taalkundig ontleden woordsoorten
handelingswijzer taalkundig ontleden woordsoorten Naslagwerk Voor leerlingen en ouders 1 INHOUD INHOUD... 2 TAALKUNDIGE ONTLEDING: WOORDSOORTEN... 3 WERKWOORDEN... 3 ZELFSTANDIG NAAMWOORD (zelfst.nw)...
Nadere informatieWERKEN MET HET WOORDENBOEK. Een trainingsprogramma in woordenboekgebruik
WERKEN MET HET WOORDENBOEK Een trainingsprogramma in woordenboekgebruik Amsterdam, februari 2006 Charlotte Berghuijs Bart Bossers Ruud Stumpel INHOUD Instructie voor de docent 3 Vaardigheden en doelen
Nadere informatieTijd en aspect in L2
Marieke Schouwstra UiL OTS 7 juni 2009 Overview L2 Acquisition Temporaliteit in L2 Data: Prebasic Data: BV Conclusie L2 Acquisition Tweede taal-acquisitie: termen Tweede taal-acquisitie = SLA (Second Language
Nadere informatieOverview. Tijd en aspect in L2. Visies op L2 acquisitie. Tweede taal-acquisitie: termen. L2 Acquisition. Temporaliteit in L2. Marieke Schouwstra
Overview Marieke Schouwstra UiL OTS 16 juni 2008 Conclusie Tweede taal-acquisitie: termen Visies op L2 acquisitie Tweede taal-acquisitie = SLA (Second Language Acquisition) = L2A (L2 acquisition) SL -
Nadere informatieOPLEIDINGEN MAATSCHAPPELIJKE ZORG AVENTUS APELDOORN / DEVENTER / ZUTPHEN STUDIEWIJZER
OPLEIDINGEN MAATSCHAPPELIJKE ZORG AVENTUS APELDOORN / DEVENTER / ZUTPHEN STUDIEWIJZER BOL/BBL NEDERLANDS 2F module 1 Taalbegrip en taalverzorging basisfase Cohort 2018 2021 kwartiel 1 en 2 DOELSTELLINGEN:
Nadere informatieData-driven identification of fixed expressions and their modifiability Villada Moirón, María Begoña
University of Groningen Data-driven identification of fixed expressions and their modifiability Villada Moirón, María Begoña IMPORTANT NOTE: You are advised to consult the publisher's version (publisher's
Nadere informatieResultaten en Beschikbaarheid 1e Ronde projecten, SPRAAK en CORNETTO Jan Odijk i.s.m. TST-Centrale
Resultaten en Beschikbaarheid 1e Ronde projecten, SPRAAK en CORNETTO Jan Odijk i.s.m. TST-Centrale STEVIN Programmabijeenkomst, Hoeven, 11 september 2008 Autonomata COREA D-Coi IRME JASMIN-CGN SPRAAK CORNETTO
Nadere informatieDUTCH PARALLEL CORPUS EN SONAR
163 DUTCH PARALLEL CORPUS EN SONAR Lieve Macken, Orphée de Clercq, Bart Desmet & Véronique Hoste Tekstcorpora spelen een belangrijke rol in verscheidene onderzoeksdomeinen en tal van toepassingen. Zo wordt
Nadere informatieThe expression of modifiers and arguments in the noun phrase and beyond van Rijn, M.A.
UvA-DARE (Digital Academic Repository) The expression of modifiers and arguments in the noun phrase and beyond van Rijn, M.A. Link to publication Citation for published version (APA): van Rijn, M. A. (2017).
Nadere informatieGebruikersinterface Osiris 6. Casussen deel 2
Gebruikersinterface Osiris 6 Casussen deel 2 (Uitgebreid) Zoeken en selecteren CACI - OSIRIS Versie document : 1.2 Versie Osiris : 6.13.1 Datum : oktober 2013 Gebruikersinterface Osiris 6 Casussen deel
Nadere informatieInhoud. Endnote X7 Handleiding Mediacentrum maart 2015 Page 2
Inhoud Over Endnote... 3 Endnote installeren... 4 Een library aanmaken... 5 Voordat je begint!... 6 Tussenvoegsels in namen... 6 Referenties invoegen in een Worddocument/Cite while you write... 7 Handmatig
Nadere informatieHerfstvergadering Koninklijke Zuid-Nederlandse Maatschappij voor Taal- en Letterkunde en Geschiedenis, 24 oktober 2014, Gent
Herfstvergadering Koninklijke Zuid-Nederlandse Maatschappij voor Taal- en Letterkunde en Geschiedenis, 24 oktober 2014, Gent Dirk Pijpops, KU Leuven, onderzoeksgroep QLVL AI Lab Agent-gebaseerde modellering
Nadere informatiePDF hosted at the Radboud Repository of the Radboud University Nijmegen
PDF hosted at the Radboud Repository of the Radboud University Nijmegen The following full text is a publisher's version. For additional information about this publication click this link. http://hdl.handle.net/2066/76270
Nadere informatieEEN COMPUTATIONELE GRAMMATICA CORPUS GESPROKEN NEDERLANDS
EEN COMPUTATIONELE GRAMMATICA VOOR HET CORPUS GESPROKEN NEDERLANDS door Ard Sprenger Scriptie voor het doctoraal examen Alfa-informatica Scriptiebegeleider: Gosse Bouma INHOUD 1. INLEIDING 3 2. CORPUSTAALKUNDE
Nadere informatieDaar het bestreden vonnis de huurovereenkomst ontbindt op de dag. van de uitspraak ervan zonder daarbij vast te stellen dat de na de
Daar het bestreden vonnis de huurovereenkomst ontbindt op de dag van de uitspraak ervan zonder daarbij vast te stellen dat de na de rechtsvordering verrichte prestaties niet voor teruggave in aanmerking
Nadere informatieNatuurlijke Taalverwerking I shift-reduce en chart parsing
Natuurlijke Taalverwerking I shift-reduce en chart parsing Gosse Bouma en Geert Kloosterman 2e semester 2005/2006 Shift-reduce conflicten Epsilon-regels Breadth-first zoeken Gebruik van een chart Toepassing:
Nadere informatieTaal- en Spraaktechnologie Ambiguïteit
2 Taal- en Spraaktechnologie Ambiguïteit Gosse Bouma 2004/2005 Zinnen zijn soms ambigu Die nacht is Marie bevallen. Hij kocht het huis op de markt. De man, die de hulpverlener heeft gered,... Ik kondig
Nadere informatieIn dit boekje staan verschillende mogelijkheden om iets op te lossen.
In dit boekje staan verschillende mogelijkheden om iets op te lossen. Mochten er aanvullingen zijn, kunt u altijd een e-mail sturen naar info@obs-delandweert.nl. ONTLEDEN Taalkundig ontleden. benoem de
Nadere informatieInleveropdracht 1: Morfologie & Syntaxis
Inleveropdracht 1: Morfologie & Syntaxis Inleiding Taalkunde 2013 Lever de uitwerking van deze opgaves op papier in tijdens college of in het cursuspostvak op Trans 10, kamer 0.16b (dat is de kamer direct
Nadere informatieAntwoorden Nederlands Ontleding
Antwoorden Nederlands Ontleding Antwoorden door een scholier 1587 woorden 27 april 2010 5,8 10 keer beoordeeld Vak Nederlands Taalkundig ontleden; Lidwoorden; Een lidwoord hoort altijd bij een zelfstandig
Nadere informatieIntra-author variation in negation: the letters of P.C. Hooft
Intra-author variation in negation: the letters of P.C. Hooft Feike Dietz, Marjo van Koppen, Irene Kramer, Marijn Schraagen Universiteit Utrecht Eindrapportage pilot Nederlab Augustus 2017 Inhoud rapportage:
Nadere informatieThema Slecht weer. Cursus drie, week zes. Prentenboek Koen wil een wolk. Josée Coenen en Ans Drubbel. d.d. juni 2016
Thema Slecht weer Cursus drie, week zes Prentenboek Koen wil een wolk Josée Coenen en Ans Drubbel d.d. juni 2016 www.watenhoe-nt2.nl, cursus drie, week zes 1 Cursus drie, week zes Zie de Inleiding voor
Nadere informatieOp weg naar moderne analyse van historische teksten. Een onderzoek naar automatische taalverwerking van zeventiende-eeuwse Nederlandse prozateksten
Op weg naar moderne analyse van historische teksten Een onderzoek naar automatische taalverwerking van zeventiende-eeuwse Nederlandse prozateksten Afstudeerscriptie RMA Nederlandse Letterkunde Tessa Wijckmans
Nadere informatieThema Dokters. Cursus drie, week vier. Josée Coenen en Ans Drubbel. d.d. juni cursus drie, week vier
Thema Dokters Cursus drie, week vier Josée Coenen en Ans Drubbel d.d. juni 2016 www.watenhoe-nt2.nl, cursus drie, week vier 1 Cursus drie, week vier Wat en hoe Dokters MN-n module 3 Lichaam Zie de inleiding
Nadere informatieNederlandse Filologie
Nederlandse Filologie Seminarie Oude Brieven Rik Vosters Centrum voor Linguïstiek 01/14/2008 Herhaling titel van presentatie 1 Herhaling: opdrachten Seminariewerk 3 opdrachten voor thuis: één transcriptie
Nadere informatieNatuurlijke-taalverwerking
Natuurlijke-taalverwerking Parse disambiguatie Week 6 Overzicht Probabilistische CFG Parsen met PCFG Afleiden van PCFG uit treebank Evaluatie Disambiguatie voor unificatiegrammatica s Disambiguatie Ambiguïteit:
Nadere informatieRéférence bibliographique. "Prosodie en vreemdetaalverwerving : accentdistributie in het Frans en in het Nederlands als vreemde taal" Rasier, Laurent
"Prosodie en vreemdetaalverwerving : accentdistributie in het Frans en in het Nederlands als vreemde taal" Rasier, Laurent Abstract In recent years quite a lot of attention has been paid to the suprasegmental
Nadere informatieEen brede computationele grammatica voor het Nederlands
Een brede computationele grammatica voor het Nederlands Leonoor van der Beek, Gosse Bouma en Gertjan van Noord Abstract We present a wide-coverage computational parser and grammar for Dutch. The grammar
Nadere informatieRAAK PRO IMDEP INNOVATIE BOUWPROCES. M. Stevens. EINDSYMPOSIUM RAAK PRO IMDPEP / WP A1.3 & WP A3.2 Heerlen, 19 januari 2016
RAAK PRO IMDEP INNOVATIE BOUWPROCES M. Stevens EINDSYMPOSIUM RAAK PRO IMDPEP / WP A1.3 & WP A3.2 Heerlen, 19 januari 2016 Emile Quanjel lector Innovatie Bouwproces & Techniek Tom Kretschmann coordinator
Nadere informatieMogelijke elementen van de microstructuur:
Mogelijke elementen van de microstructuur: semantische informatie - betekenisomschrijving (definitie) - semantische relaties tussen betekenissen bij polyseme woorden - semantische relaties tussen woorden
Nadere informatieNaam: Mijn doelenboekje. Grammatica. Werelden - Eilanden - Dorpen 5 / 6 / 7 / 8.
Naam: Mijn doelenboekje Grammatica Werelden - Eilanden - Dorpen 5 / 6 / 7 / 8 www.gynzy.com Inhoud & Legenda In dit doelenboekje zijn de volgende Werelden te vinden: Taalkundige ontleding...3 Redekundige
Nadere informatieinstapkaarten taal verkennen
7 instapkaarten inhoud instapkaarten Taal verkennen thema 1 les 2 1 thema 1 les 4 2 thema 1 les 7 3 thema 1 les 9 4 thema 2 les 2 5 thema 2 les 4 6 thema 2 les 7 7 thema 2 les 9 8 thema 3 les 2 9 thema
Nadere informatieHomework assignment 7 (Intensionality)
Homework assignment 7 (Intensionality) Semantiek 2013 Solutions Opgave 1 Bekijk de volgende zinnen: A. Lewis Carroll is Charles Dodgson, en Tina ontmoette Charles Dodgson. B. Lewis Carroll is Charles Dodgson,
Nadere informatieGernEdiT The GermaNet Editing Tool
GernEdiT The GermaNet Editing Tool Verena Henrich and Erhard Hinrichs University of Tübingen Department of Linguistics LREC 2010, Malta, May 2010 Introduction GernEdiT (GermaNet Editing Tool) User-friendly
Nadere informatieWord Sense disambiguation. Taal en Spraak Maaike Harbers 1 mei 2006
Word Sense disambiguation Taal en Spraak Maaike Harbers 1 mei 2006 Overzicht Introductie Methoden om te desambigueren Informatiebronnen voor desambiguatie Evaluatie van een desambiguatie systeem Ambiguiteit
Nadere informatieENGELS. Maak oefeningen lesson 1 Leer: words lesson 1, onr. ww. 1 t/m 10. Extra opdrachten Unit 5: Niveau 1, 2/ Niveau 2, 3.
Periode 5 5 april t/m 28 juni. 209 ENGELS Klas 2 Naam: Opmerkingen: Je maakt 2 toetsen:. een toets over: Unit 5, meervoud zelfstandig naamwoorden en onregelmatige werkwoorden Leren: TB blz. 84 t/m 87,
Nadere informatieSpiekkaart. Persoonsvorm - p.v.
Persoonsvorm - p.v. DE PERSOONSVORM IS EEN WERKWOORD 1. 2. 3. Zet de zin in een andere tijd: Muis schrijft een brief. Muis schreef een brief. Het werkwoord dat verandert is de persoonsvorm. Maak van de
Nadere informatieDavid Weenink. Instituut voor Fonetische Wetenschapen ACLC Universiteit van Amsterdam. Spraakverwerking per computer.
Instituut voor Fonetische Wetenschapen ACLC Universiteit van Amsterdam AMSTERDAM CENTER FOR LANGUAGE AND C O M M U N I C A T I O N 5000 4000 3000 Hz 2000 1000 0 de vrouw loopt met haar dure schoenen 0.3
Nadere informatieSamenstellingen en tussenklanken.
Samenstellingen en tussenklanken. Een onderzoek naar de geschiedenis van de tussenklank in nominale samenstellingen. Bob van Tiel Radboud Universiteit Nijmegen Samenstellingen Weinig beperkingen bij het
Nadere informatieTechnisch rapport SumNL corpus
Technisch rapport SumNL corpus Iris Hendrickx CNTS - Language Technology Group, University of Antwerp, Universiteitsplein 1, Antwerp Belgium iris.hendrickx@ua.ac.be 1 Introductie Het SumNL corpus is ontwikkeld
Nadere informatieParse and Corpus-based Machine Translation. STEVIN Programmadag 2010 1
PaCo-MT Parse and Corpus-based Machine Translation STEVIN Programmadag 2010 1 Project: PaCo-MT 2008-2011 Gesponsord door NL EN NL FR Consortium partners CCL KULeuven Alfa-Informatics RUGroningen OneLiner
Nadere informatieStandard Parts Installatie Solid Edge ST3
Hamersveldseweg 65-1b 3833 GL LEUSDEN 033-457 33 22 033-457 33 25 info@caap.nl www.caap.nl Bank (Rabo): 10.54.52.173 KvK Utrecht: 32075127 BTW: 8081.46.543.B.01 Standard Parts Installatie Solid Edge ST3
Nadere informatieTopics in Corpus-Based Dutch Syntax Beek, Leonoor Johanneke van der
Topics in Corpus-Based Dutch Syntax Beek, Leonoor Johanneke van der IMPORTANT NOTE: You are advised to consult the publisher's version (publisher's PDF) if you wish to cite from it. Please check the document
Nadere informatieAlle opgaven tellen even zwaar, 10 punten per opgave.
WAT IS WISKUNDE (English version on the other side) Maandag 5 november 2012, 13.30 1.30 uur Gebruik voor iedere opgave een apart vel. Schrijf je naam en studentnummer op elk vel. Alle opgaven tellen even
Nadere informatieuniversiteitsbibliotheek Rapportages Oktober 2016
1 Rapportages Oktober 2016 2 Inhoudsopgave Algemeen Standaardrapportages KUOZ rapportage: uitgewerkt SEP rapportage: kort SEP module Geen rechten voor rapportagemodule of SEP-module: deze zijn aan te vragen
Nadere informatieWat hebben de lexicograaf en de foneticus elkaar te vertellen? Truus Kruyt
Wat hebben de lexicograaf en de foneticus elkaar te vertellen? Truus Kruyt aangepaste versie t.b.v. werkcollege Corpusonderzoek Universiteit Münster 2007/2008 Overzicht van de presentatie Relaties tussen
Nadere informatieHandouts - lesson 4 - #dutchgrammar - 9 april the verb. het werkwoord. regular verb conjugation
#dutchgrammar for beginners - lesson 4 1 the verb het werkwoord 2 to watch ik kijk jij kijkt u kijkt hij kijkt zij kijkt het kijkt wij jullie zij 3 most verbs end with: -en first person singular: without
Nadere informatieThema Wie niet sterk is. Prentenboek Zwemmie. Cursus twee, week vijf. Josée Coenen en Ans Drubbel. d.d. 12 maart 2016
Thema Wie niet sterk is Prentenboek Zwemmie Cursus twee, week vijf Josée Coenen en Ans Drubbel d.d. 12 maart 2016 www.watenhoe-nt2.nl, cursus twee, week vijf 1 Cursus twee, week vijf Zie de Inleiding voor
Nadere informatieInformatie over kerndoelen en leerdoelen Alles-in-1 en Alles-Apart
Informatie over kerndoelen en leerdoelen Alles-in-1 en Alles-Apart Alles-in-1 biedt, samen met Alles-Apart, kerndoelendekkende leerstof aan voor groep 4 t/m 8 voor alle vak- en leergebieden behalve rekenen,
Nadere informatiePraktische gebruiksaanwijzing
Praktische gebruiksaanwijzing Corea-crew 16 augustus 2007 Hoe annoteer ik coreference? Zoek de eerste mogelijke anafoor. Zoek vanaf de anafoor terug in de tekst naar een antecedent waarmee een goede anaforische
Nadere informatieDE AAN HET INFINITIEF-CONSTRUCTIE IN HET NEDERLANDS
GEERT BOOIJ DE AAN HET INFINITIEF-CONSTRUCTIE IN HET NEDERLANDS 1. Inleiding Veel talen van Europa gebruiken syntactische constructies om progressief aspect uit te drukken (Bertinetto e.a. 2000). Globaal
Nadere informatieVerwerking van achttiende-eeuws Nederlands met Frog
Verwerking van achttiende-eeuws Nederlands met Frog Erik Tjong Kim Sang Meertens Instituut erikt(at)xs4all.nl 13 februari 2014 1 Inleiding Frog [1] is een verzameling programma s voor de taalkundige analyse
Nadere informatieMasterexamen Nederlands
Masterexamen Nederlands 1. Richtlijnen masterexamen Nederlands 1.1. Inleiding 1.2. Scriptie 1.2.1. Vertaalscriptie 1.3. Letterkundig/taalkundig essay 1.4. Mondelinge toets 1.5. Vertaling 2. Inleveren scripties
Nadere informatieInformatie over het examen Nederlands als Tweede Taal niveau 6
Informatie over het examen Nederlands als Tweede Taal niveau 6 Dit examen doen deelnemers aan de taalcursus Nederlands Niveau 5+6 aan de Universiteit Leiden. Deze cursus bestaat uit 110 contacturen. De
Nadere informatie1e Deeltentamen Inleiding Taalkunde
1e Deeltentamen Inleiding Taalkunde 28/05/2009 13.15-16.15 Dit tentamen heeft 5 vragen. Je hebt drie uur de tijd om deze te beantwoorden. Vergeet niet je naam en studentnummer steeds duidelijk te vermelden.
Nadere informatiePDF hosted at the Radboud Repository of the Radboud University Nijmegen
PDF hosted at the Radboud Repository of the Radboud University Nijmegen The following full text is a publisher's version. For additional information about this publication click this link. http://hdl.handle.net/2066/142381
Nadere informatieHet WNT: een Waarlijk Nuttige Tool? Jack Hoeksema, RU Groningen
Het WNT: een Waarlijk Nuttige Tool? Jack Hoeksema, RU Groningen 1. Woordenboeken in het onderzoek Aan de universiteiten wordt er steeds minder zuiver lexicografisch onderzoek gedaan. De tijd dat de Rijksuniversiteit
Nadere informatieDe automatische analyse van subjectiviteit en causale samenhang in tekst
De automatische analyse van subjectiviteit en causale samenhang in tekst Wilbert Spooren Met dank aan: Erwin Komen, Micha Hulsbosch, Iris Hofstra, Patrick Sonsma Jet Hoek, Ted Sanders Clariah Subjectiviteit
Nadere informatieNiemand hoeft verlegen te zijn
Centrum Basiseducatie Brusselleer Oefenmap lezen en schrijven p. 1 Verlegen mensen Niemand hoeft verlegen te zijn Kleine kinderen zijn vaak verlegen. Dat vindt iedereen normaal. Maar ook 1 op 5 volwassenen
Nadere informatieDNA Profile. DNA profielen. DNA profielen. DNA profielen. DNA profielen
Succesvol Onderscheidend vermogen Wetenschappelijke grondslag Precieze statistische informatie (Random Match Probability) www.ai.rug.nl/forensicscience/ DNA Profile Locus Alleles times allele observed
Nadere informatieExposure Control Efficacy Library (ECEL)
ary (ECEL) Development and Evaluation 2 Wat is ECEL? MS Access database - brede scala van RMMs - kwantitatieve effectiviteitswaarden - inhalatoire blootstelling aan stoffen Oorspronkelijk ontwikkeld voor
Nadere informatieQuestion Answering. College Natuurlijke Taalinterfaces. Januari 2002
Question Answering College Natuurlijke Taalinterfaces Januari 2002 1 Information Retrieval, Web Search Zoek relevante documenten over een bepaald onderwerp. Vraag: keywords (en boolese connectieven), Bin
Nadere informatieInformatiekunde in Groningen
kunde in John Alfa-informatica Rijksuniversiteit Huus van de Taol 3 juni 2009 Technologie voor taal kunde Studie waar computer centraal staat: Programmeren, ontwerpen, analyseren van ICT producten Gericht
Nadere informatieLexicale convergentie in de Nederlandse woordenschat
Overzicht Inleiding Het Nederlands Methode Resultaten Lexicale convergentie in de Nederlandse woordenschat Jocelyne Daems Kris Heylen Dirk Geeraerts KU Leuven OG Kwantitatieve Lexicologie en Variatielinguı
Nadere informatiePart of Speech Tagging en Lemmatisering
Part of Speech Tagging en Lemmatisering Frank Van Eynde Centrum voor Computerlinguïstiek K.U.Leuven december 2000 voor gebruik in het project Corpus Gesproken Nederlands (1998-2003) Inhoudsopgave 1 INLEIDING
Nadere informatieAutomatic lexico-semantic acquisition for question answering Plas, Marie Louise Elizabeth van der
Automatic lexico-semantic acquisition for question answering Plas, Marie Louise Elizabeth van der IMPORTANT NOTE: You are advised to consult the publisher's version (publisher's PDF) if you wish to cite
Nadere informatie