Woorden
Wat zijn de grammaticale basiselementen? Woorden? Hetzelfde woord komt vaak in veel vormen voor: koek / koeken / koekje / koekjes boek / boeken / boekje / boekjes dansen / dans / danst / danste / gedanst bakken / bak / bakt / bakte / gebakt Deze vormen kennen een bepaalde productiviteit (nieuwe woorden) faxen: fax, faxt, faxen, faxte, gefaxt sms: smsje, smsjes
Wat zijn de grammaticale basiselementen? Lexicale opslag: kostbaar, inefficiënt Gemiste generalisatie: agreement (congruentie) een koek / *een koeken / een koekje / *een koekjes een boek / *een boeken / een boekje / *een boekjes *ik dansen / ik dans / *ik danst / ik danste *ik bakken / ik bak / *ik bakt / ik bakte Bijvoorbeeld: [een enkv koek enkv ], [ik 1e bak 1e ] Niet woorden, maar morfemen als basiselementen
Morfemen als grammaticale basiselementen Wat is een morfeem? Morfemen zijn de kleinste betekenisdragende elementen in een taal Morfemen bestaan uit één of meer fonemen Let op: een morfeem is *niet* hetzelfde als een lettergreep (morfeem syllabe)
Voorbeelden van morfemen boter groter chocolaatjes schoolbord gewandeld wandeling
Voorbeelden van morfemen boter grot-er chocolaa-tje-s school-bord ge-wandel-d wandel-ing
Soorten morfemen Gebonden morfemen: niet zelfstandig bruikbaar Vrije morfemen: wel zelfstandig bruikbaar boter grot-er chocolaa-tje-s school-bord ge-wandel-d wandel-ing
Soorten morfemen Stammen Affixen happy, gein, mani, fiets Prefixen Suffixen Infixen Circumfixen unhappy geinig mawani gefietst Lakhota (North/South Dakota, een Sioux-taal): mani loop mawani ik loop
Infixatie Infixatie komt redelijk veel voor: Cantonees: yuhksyūn => yuhk-gwái-syūn lelijk => verschrikkelijk lelijk (gwái duivel) Engels: fantastic => fan-bloody-tastic
Reduplicatie Reduplicatie: een stam (of een deel ervan) vormt een affix aan de stam zelf Yidiny (Noord Queensland, Australië): reduplicatie als meervouds-markering gindalba (Hagedis) gindalgindalba (Hagedis.Meerv) Hausa (West-Afrika / Sahel): reduplicatie als intensificatie can (daar) can-can (ver weg) maza (snel) maza-maza (erg snel) dare (avond/nacht) daddare (laat in de avond) Vgl: Hij sliep en sliep en sliep.
Hoe morfemen combineren stoel => stoel-en steel => steel-t stoel > stoel-t Er is een rol weggelegd voor woordsoort De drie voornaamste processen waarmee morfemen combineren Derivatie Inflectie Samenstellen (compounding)
Wat zijn woordsoorten eigenlijk? Lexicale categorieën versus Grammaticale categorieën Lexicale categorieën: N (noun), A (adjective/adverb), V (verb) N: stoel, water, gezelligheid, verzinseltjes A (adjective): rood, gezellig, mooi A (adverb): gisteren, vaak, wel V: wandelen, gegeten, at
Wat zijn woordsoorten eigenlijk? Lexicale categorieën versus Grammaticale categorieën Grammaticale categorieën: D (determiner): lidwoorden (de, het, een), telwoorden (drie, veel), kwantoren (elke, alle, geen) Pronomina: hij, zij, ik, hun, jullie Voegwoorden: want, en, maar, omdat C (complementizer): dat P (preposition): in, op, onder, voor, met
Wat zijn woordsoorten eigenlijk? Lexicaal: stoel, water, gezelligheid, verzinseltjes, rood, gezellig, mooi, gisteren, wandelen,... Grammaticaal: de, het, een, drie, elke, alle, geen, hij, zij, want, omdat, maar, en, als, dan
Wat zijn woordsoorten eigenlijk? Lexicale categorieën versus Grammaticale categorieën Lexicale categorieën: Inhoudswoorden Open klasse; er is ruimte voor nieuwe woorden Veel morfologie Referentiële betekenis Grammaticale categorieën: Functiewoorden Gesloten klasse; weinig vernieuwing Weinig morfologie Betekenis moeilijk in isolatie te bepalen
Morfologie en woordsoorten Compounding: inhoudswoord + inhoudswoord = inhoudswoord Derivatie: toepassing van gebonden morfeem de woordsoort verandert meestal Inflectie: toepassing van gebonden morfeem behoud van woordsoort gedreven door specifieke syntactische omgeving vormt een paradigma
Compounding Relatief simpel morfologisch mechanisme Twee inhoudswoorden worden aan elkaar geplakt om een nieuw inhoudswoord te vormen School-bord, tafel-kleed, achter-ingang, schaats-baan vries-drogen, zand-stralen sneeuw-wit, bloed-rood Compounding herken je aan klemtoon zwartboek / zwart boek kleinkind / klein kind black board
Derivatie Inhoudswoorden combineren met een grammaticaal morfeem om een nieuw inhoudswoord te vormen, meestal van een andere categorie wandel-ing, schrijv-er, computer-en, ver-grijz-en blauw-ig, on-logisch, be-drinken bemoeizucht-ig-heid Derivatie is niet ongelimiteerd toepasbaar: *schrijv-ing, *on-verdrietig, *be-eten
Inflectie Inhoudswoorden combineren met een grammaticaal morfeem om een nieuwe vorm van hetzelfde woord (dezelfde categorie) te krijgen Inflectie is grammaticaal relevant (het nalaten van inflecteren kan resulteren in een ongrammatikale expressie), dit in tegenstelling tot derivatie *deze boek / deze boek-en *de man zijn... / de mann-en zijn... dit boek / dit boek-je de gelukkige vrouw is... / de on-gelukkige vrouw is... Belangrijk: verschillende typen inflectie bij verschillende categorieën inflectie inflectie derivatie derivatie
Inflectie op N Enkelvoud/meervoud: boek / boek-en Naamval (case): König (koning) Duits Der Mann sieht den Sohn des Königs in dem Garten De 1 man ziet de 4 zoon de 2 koning.2 in de 3 tuin Naamval (case): talo (huis) Fins talo nominatief talo-n accusatief talo-na talo-ksi talo-ssa partitief translatief inessief
Inflectie op A Vergrotende trap: Nederlands: slim => slimmer Engels: smart => smarter Duits: schlau => schlauer Niet altijd morfologisch: More beautiful / *beautifuller meer nodig / *nodiger De meeste talen: geen morfeem voor vergrotende trap Nihongo-wa doitsgo yori muzukashi Japanese-TOP German from difficult Japanese is more difcult than German. (Japans)
Inflectie op V Getal: ik loop / wij lopen Persoon: ik loop / hij loopt Tijd: ik stap / ik stapte enkelv/meerv 1e/3e TT/VT Nederlands versus Spaans: 1e 2e 3e spreek spreekt spreekt enkelv spreken spreken spreken meerv 1e 2e 3e hablo hablas habla enkelv hablamos habláis hablan meerv
Inflectie op V Wijs (mood): Conjunctief (aanvoegende wijs): zo waarlijk helpe mij God almachtig leve de Koningin! Indicatief (aantonende wijs): hij helpt mij de Koningin leeft Imperatief (gebiedende wijs): help mij! stop met roken!
Inflectie versus Derivatie Inflectie is categorie-gebonden en vindt na derivatie plaats Tafel-tje-s / *Tafel-s-tje Wandel-ing / *Wandel-t-ing / *Wandel-ing-t
Woordstructuur on-gelukkig-er on gelukkig er of on gelukkig er? Semantiek kiest voor één van deze varianten
Inflectiemodel met Finite State Automaat table tables sheep mouse mice
Derivatiemodel met Finite State Automaat Derivatiemodel is doorgaans moeilijker en complexer dan inflectiemodel Voorbeeld: derivatie op bijvoeglijk naamwoorden redelijk / redelijk-erwijs / on-redelijk
Derivatiemodel met Finite State Automaat redelijk / redelijk-erwijs / onredelijk
Derivatiemodel met Finite State Automaat redelijk / redelijk-erwijs / onredelijk onredelijkerwijs
Derivatiemodel met Finite State Automaat redelijk / redelijk-erwijs / onredelijk onredelijkerwijs (284 Google hits) En ja, ook ik knipper met mijn lichten, als een vrachtwagen mij onredelijkerwijs in de ankers wil dwingen! Echter niet, als het redelijk is! *dommerwijs / *ondom / *ondommerwijs / domweg *redelijkweg (0 Google hits) dom genoeg, vreemd genoeg, *vreemderwijs, *vreemdweg
Levels of morphological analysis phonology/orthography recognizing stem + morphological rules (e.g. number) surface level interim level lexical level
Levels of morphological analysis phonology/orthography recognizing stem + morphological rules (e.g. number) surface level interim level foxes fox^s# lexical level fox +N +PL This model establishes an input/output relation useful for both analysis and generation
English morphological number rule - Tnum # - end of word ^ - end of morpheme Analyzing singularity/plurality in regular and irregular nouns
Stemming and categorization of nouns - Tstems @ = wildcard A dictionary dictionary categorizing nouns as regular/irregular
Abstract Plurality phonology/orthography fox^s phonology: /foksez/ orthography: foxes In both cases there are rules for adding S!
Orthographic rule e before s FST for connecting surface string with stemmed string: girl girl# girls girl^s# fox fox# foxes fox^s#