Semantische. Eindwerkstuk voor Information Retrieval Wybo Wiersma, s

Maat: px
Weergave met pagina beginnen:

Download "Semantische. Eindwerkstuk voor Information Retrieval Wybo Wiersma, s"

Transcriptie

1 Semantische Zwaartekracht Eindwerkstuk voor Information Retrieval Wybo Wiersma, s

2

3 Wybo Wiersma Semantische Zwaartekracht 1 Inhoudsopgave Inleiding Eerder werk Window gebaseerde Information Retrieval Querie Expansie met Collocaties Lexicale Constellaties Onderzoeksopzet WordNet Windows Normalisaties Resultaten Algemene vorm Nouns Adjectives Verbs Adverbs Auxiliaries Conclusie Literatuurlijst

4 Inleiding Wybo Wiersma Semantische Zwaartekracht 2 Information Retrieval (IR) is in toenemende mate belangrijk voor de kennis samenleving. De hoeveelheid min of meer ongestructureerde informatie neemt in rap tempo toe, en de noodzaak om snel sneller dan de buurman de juiste informatie te bemachtigen wordt steeds groter. In deze race for information is spelen IR technieken een centrale en instrumentele rol. Eén van de in mijn ogen erg interessante ontwikkelingen binnen de IR van dit moment is het loslaten van het document als de eenheid waarbinnen gezocht wordt. Ook bij het automatisch uitbreiden van queries wordt door sommige onderzoekers het document als werk eenheid losgelaten. In de papers van Qianli Jin en Jun Zhao wordt bijvoorbeeld inplaats van naar het hele document, of vaste stukken daaruit (chunks), gekeken naar de termen die samen voorkomen binnen een bepaalde afstand van elkaar. De maximum afstand waar nog naar gekeken wordt heet hier het window. Binnen het window wordt naar links en naar rechts gekeken van een term waarvan men al weet dat deze bij de querie hoort. Deze term noemen we hier de centrale term. Het cruciale verschil tussen chunks en windows is dat windows altijd relatief zijn tenopzichte van een centrale term, terwijl chunks een soort mini documentjes zijn die ook niet kunnen overlappen. Ook ikzelf heb gebruik gemaakt van window's in mijn eerdere essay: Tweak Test. 1 Op basis van de vooralsnog beschikbare informatie lijkt het niet onmogelijk dat deze window based aanpak een verbetering kan betekenen ten opzichte van de document en chunk gebaseerde aanpak. In dit essay wordt daarom gekeken naar de semantische eigenschappen van taal binnen windows. In zinnen vindt men naast syntactische (grammaticale) ook semantische (e.g. betekenis ) relaties. De betekenis relatie tussen twee woorden in een zin kan tot op zekere hoogte uitgedruk worden in een getal als een mate van semantische gerelateerdheid. Men zou tot een dergelijk getal kunnen komen door bijvoorbeeld aan verschillende mensen te vragen de betekenis relatie tussen het woord 'hond' en 'riem' een cijfer te geven tussen 0 en 5. Een database waarin voor meer dan woorden dit soort relaties zijn opgeslagen is WordNet. Deze database hebben we gebruikt om voor een heel corpus patronen te vinden in de geaggregeerde semantische relaties binnen zinnen. Ten eerste hebben we een beeld gemaakt van de algemene vorm van de semantische gerelateerdheid binnen windows: op welke afstand is welke mate van semantische gerelateerdheid te verwachten. Ten tweede heeft dit essay ook een taalkundige kant. Er is namelijk ook een eenvoudige analyse gemaakt van de relatie tussen het part of speech (POS) van een woord, en de vorm van de semantische gerelateerdheid. Het gebruik van POS taggers bij IR taken is immers ook een interessante en veel gebezigde strategie. De aanpak in dit essay was uitdrukkelijk empirisch en verkennend. Het is verkennend in de zin dat er geen statistische significantie is bepaald voor de resultaten. Het is empirisch in dat er gebruik is gemaakt van een corpus. De aanpak is er al met al één van data mining. Met Wordnet::Similarity, een library om WordNet vanuit een script te kunnen aanroepen, is steeds de semantische afstand tussen een centraal woord en haar window berekend en deze afstanden, voor alle woorden, respectievelijk woorden met een specifieke POS tag, zijn opgeteld voor alle posities afzonderlijk en vervolgens genormaliseerd voor de distributie van de termen in de zinnen. Langs deze weg is de semantische zwaartekracht bepaald in het algemeen en voor bepaalde POS tags. De aldus verkregen resultaten zijn vervolgens in grafieken weergegeven. 1 Wybo Wiersma, 'Tweak Test: van Sformula, WordNet, Naked Keywords & Random Retrieval', WyboWiermsa.pdf (2004).

5 Eerder werk Wybo Wiersma Semantische Zwaartekracht 3 Voordat dit onderzoek begon zijn een drietal papers bekeken. Ze worden hieronder beknopt samengevat. De eerste beschrijft een methode voor het zoeken, de tweede voor de uitbreiding van queries, en de laatste gaat in op de mogelijke eigenschappen van semantische zwaartekracht. Window gebaseerde Information Retrieval In de paper van Qianli Jin, Jun Zhao en Bo Xu getiteld: 'Window based Method for Information Retrieval' worden een aantal window gebaseerde methodes voor Information Retrieval voorgesteld. De eerste door hen beschreven methode houdt in dat documenten waarin de termen uit de querie dicht bij elkaar (binnen een vast window) voorkomen, zwaarder gewogen worden. De tweede bouwt hierop voort en neemt ook de afstand in beschouwing, en geeft een bonus voor minder afstand. Bij de derde methode wordt een window extra beloond wanneer er een named entity (naam van een persoon, organisatie of plaats) of een zelfstandig naamwoord uit de querie in voorkomt. Alledrie deze methodes presteren aanzienlijk beter dan de gebruikelijke tf idf methode, en de derde presteert het beste. Querie Expansie met Collocaties 'Query Expansion with Long Span Collocates', de paper van Olga Vechtomova, Stephen Robertson en Susan Jones, gaat in op de mogelijkheden voor querie expansie met behulp van collocatie informatie. Ze definiëren collocaties als woorden die statistisch gezien vaker samen voorkomen in een window dan toevalligerwijs verwacht kan worden. Woorden die sterk correleren met de termen uit de querie worden toegevoegd aan de querie in de hoop dat deze woorden semantisch gerelateerd zijn en dus betere zoekresultaten opleveren. Het verschil tussen korte afstands collocaties (< 10) die het meeste door grammaticale structuren en contstraints worden bepaald en lange afstands collocaties (> 10, tot een paar honderd woorden) die eerder semantisch van aard is wordt door hen gemaakt, maar verder niet uitgewerkt. Wel zetten ze querie expansie op basis van alle teksten in het corpus (globaal) af tegen die gebaseerd op een al relevant bevonden subset en ze concluderen dat deze laatstgenoemde methode beter werkt dan de globale. Lexicale Constellaties In 'Lexical Constellations: What Collocates Fail to Tell' wordt door Pascual Cantos en Aquilino Sánchez een case study gedaan naar de frequenties van collocaties van het Engelse woord voor letterteken (letter) en het Spaanse woord voor verf (mano). Zij geven effectief de semantische gravitatie weer voor deze beide termen en ze komen tot een aantal interessante conclusies. Zo hebben deze beide woorden heel verschillende gravitatie grafieken, en is de verdeling niet normaal en niet symmetrisch, zeker verder van het centrum (> 10 woorden afstand). Ook zetten ze uiteen dat collocaties over grotere afstanden ook indirect via andere woorden kunnen optreden, enigszins vergelijkbaar met het feit dat de zon de aarde aantrekt, en de aarde op haar beurt de maan, waardoor ook zon en maan 'colloceren'. Ze spreken daarom van lexicale constellaties. Vanuit grammaticaal, en zeker vanuit semantisch oogpunt is deze partiële transitiviteit van collocaties geen hele grote verassing, maar het biedt wel een interessante kijkwijze.

6 Onderzoeksopzet Wybo Wiersma Semantische Zwaartekracht 4 Er is met WordNet::Similarity gekeken naar semantische zwaartekracht binnen windows, en hierbij is rekening gehouden met de algemene distributie van termen in zinnen. Achtereenvolgens beschrijf ik deze stappen. WordNet Voor dit onderzoek is het Britse ICE corpus gebruikt. Dit corpus telt een miljoen woorden, verdeeld over geschreven en gesproken tekst. Dit corpus was al voorzien van POS tags, maar nog niet semantisch ge disambigueerd. Dit was nodig om in de volgende stap de semantisch afstand te kunnen berekenen. Woorden met verschillende betekenissen hebben namelijk natuurlijk ook verschillende semantische afstanden van elkaar. Voor dit disambigueren is WordNet::Similarity::Senserelate (een library voor dit doel) gebruikt. WordNet::Similarity::Senserelate was echter erg traag. Het disambigueren van het hele ICE corpus had vele weken, zo niet maanden in beslag genomen. Daarom heb ik een aantal verbeteringen en optimalisaties doorgevoerd in WordNet::Similarity die ook zijn opgenomen in de nieuwe releases. 2 Een van de verbeteringen is een cache in WordNet::Similarity::lesk (een methode voor het berekenen van semantische afstanden die door Senserelate gebruikt wordt), die de recentelijk vergeleken woorden onthoudt, en een andere voor deze zelfde methode (lesk) is een efficiëntere implementatie van het algoritme wat de beschrijvingen bij de verschillende senses vergelijkt. Een verdere verbetering die is doorgevoerd is het vooraf berekenen van de afstanden tussen alle woordparen in het hele corpus die binnen het voor de disambiguatie gebruikte window voorkomen (dit window heeft een straal van maar 5 woorden). Dit is gedaan aangezien behalve Senserelate, ook WordNet::Similarity::lesk vrij traag is. Deze voor berekende afstanden worden vervolgens via een hiervoor speciaal ontwikkelde database lezende semantische afstands library door het disambiguatie algoritme gebruikt. Al met al zorgden deze aanpassingen er voor dat de disambiguatie binnen een paar dagen te doen was. 2 onderaan de pagina.

7 Wybo Wiersma Semantische Zwaartekracht 5 Windows Bij het onderzoeken van de semantische zwaartekracht hebben we onze windows onderbroken bij zins grenzen. We hebben dit gedaan omdat deze beperking het gedrag van de semantische zwaartekracht rond specifieke POS tags makkelijker te relateren maakt aan grammaticale invloeden. Bovendien was ons corpus al opgedeeld in zinnen en was het dus makkelijk om deze indeling aan te houden. Aansluitend bij de te verwachten zins lengtes hebben als straal van de windows een andere gekozen dan de 5 voor de disambiguatie, namelijk 49 posities. Inclusief het centrale woord waaromheen het window valt waren de windows dus 99 posities breed. Uit de inleiding gerecapituleerd: windows zijn geen chunks; tussen windows kan overlap bestaan. Ze schuiven als het ware langs de data met steeds het volgende woord als het centrale woord, vergelijkbaar met hoe het raam in een trein wagon steeds een ander deel van het landschap omlijst. De afbeelding hieronder maakt dit duidelijk: Windows van 99 posities breed bewegen door de tekst met C steeds als het volgende centrale woord Binnen het onderzoek zijn voor alle window posities de semantische afstanden tussen het centrale woord en de daaromheenliggende woorden berekend. Vervolgens zijn deze waardes per afstand van het dus steeds wisselende centrale woord opgeteld. We houden dus een lijst over met 98 gesommeerde waardes: voor elke positie vanaf het midden eentje (in beide richtingen). De afbeelding hieronder illustreert dit: De semantische afstanden worden opgeteld voor de 98 posities over alle verschuivende window views

8 Wybo Wiersma Semantische Zwaartekracht 6 Normalisaties Wederom om de interpretatie te bevorderen en vooral om de invloed van verschil in frequentie (hoeveelheid data) weg te filteren, zijn de resultaten als eerste stap genormaliseerd door ze te delen door de som van de waardes voor alle posities gedeeld door 98. Met andere woorden; ze zijn genormaliseerd voor de gemiddelde waarde per positie. Hiermee is deze gesteld op 1, en wordt alles wat hoger is dan gemiddeld, hoger dan 1, en lager, lager dan 1. Daarnaast zijn de sommen die we verkregen hebben zijn nog niet de zuivere semantische zwaartekracht. Omdat we de windows hebben afgebroken bij de zins grenzen en dus windows zeer regelmatig minder breed waren dan 99 woorden hebben we ook rekening moeten houden met de algemene distributie van termen in zinnen. De alhier verkregen sommen zijn dus een composite. De volgende grafiek met daarin o.a. de gevonden samengestelde semantische zwaartekracht laat de situatie van de compositie zien. Genormaliseerde samengestelde semantische zwaartekracht en zins en semantische term distributies De blauwe lijn is de samengestelde semantische zwaartekracht. De rode lijn is de algemene distributie van woorden in zinnen. Dit is het aantal keren dat op een bepaalde afstand (positie) van een centraal woord, een ander woord voorkomt. Deze is berekend op de zelfde manier als de samengestelde semantische zwaartekracht, maar met als semantische afstand steeds 1. De groene lijn geeft de distributie weer van semantische termen in zinnen. Het verschil met de zins distributie (de rode) is dat hier alleen de termen zijn meegenomen waarvoor WordNet::Similarity een semantische afstand

9 kon berekenen. Wybo Wiersma Semantische Zwaartekracht 7 De basis vorm komt voort uit de distributie van termen in de zinnen, die, zoals te zien is aan de rode lijn zeer regelmatig en vrijwel perfect hyperbolisch is, afgezien van de top (en het feit dat ze de y as wel snijdt). De afgeplatte top is echter het gevolg van de keuze om in deze en volgende grafieken voor het centrale woord de gemiddelde waarde van de eerste linker, en rechter posities te nemen, zodat ze niet nul zijn, en er een loodlijn weergegeven kan worden op de 0 positie. Zonder 0 positie zou de loodlijn namelijk op +1 of op 1 getekend moeten worden, en dat zou de interpretatie minder makkelijk maken. De distributie van semantische termen laat echter iets anders zien dan een hyperbool. Zoals uitvergroot in de volgende grafiek te zien is, is de distributie van semantische termen (groen) rond de top krater vormig. Uitvergrootte samengestelde semantische zwaartekracht en zins en semantische term distributies Deze onregelmatigheid rond de top (+ 3 en 3 woorden) kan verklaard worden vanuit twee factoren. De eerste is een ruisfactor, en komt voort uit het feit dat er binnen WordNet samengestelde woorden voorkomen, en dezen hebben de positie van hun eerste deel (woord) toegewezen gekregen, en niet die van hun verdere delen. Hierdoor zal zo nu en dan direct na, of voor een woord geen ander woord te vinden zijn. De andere oorzaak is grammaticaal: lidwoorden, voorzetsels, etc. komen niet voor in

10 Wybo Wiersma Semantische Zwaartekracht 8 WordNet en hebben geen semantische kwaliteiten, en dus zijn ze nooit semantische termen. Derhalve zijn semantische termen dikwijls niet direct na elkaar te vinden. Aangezien deze beide effecten direct rond het centrale woord nog niet weggemiddeld worden zijn ze daar zichtbaar en invloedrijk. Om een lang verhaal kort te maken is om te compenseren voor zowel de onregelmatige distributie van semantische termen rond de top, alsook voor de hyperbolische distributie van woorden in zinnen, als tweede normalisatie stap de samengestelde semantische zwaartekracht gedeeld door de distributie van semantische termen om de semantische zwaartekracht te berekenen. Behalve een algemene semantische zwaartekracht over alle semantische termen, hebben we ook een semantische zwaartekracht berekend voor verschillende POS tags. In dit laatste geval zijn de 98 waardes voor verschillende window posities alleen opgeteld voor centrale woorden met een bepaalde POS tag. Tenslotte zijn van al deze resultaten grafieken gemaakt.

11 Resultaten Wybo Wiersma Semantische Zwaartekracht 9 In de eerste paragraaf wordt ingegaan op de eigenschappen van de semantische zwaartekracht in het algemeen, ongeacht POS tags. In de daaropvolgende paragrafen zullen de resultaten voor verschillende POS tags worden gepresenteerd. De semantische zwaartekracht is berekend voor de volledige 180 delige ICE tagset. Voor veel van de tags was echter te weinig data beschikbaar. Tevens zouden de overige 30+ resultaten sets te ver voeren voor het bestek van dit eerste essay. Vandaar dat de data uiteindelijk is opgeteld voor de gereduceerde ICE tagset, en hieruit alleen voor nouns (N), adjectives (ADJ), verbs (V), adverbs (ADV) en auxiliaries (AUX). Maar nu eerst de algemene vorm.

12 Wybo Wiersma Semantische Zwaartekracht 10 Algemene vorm De semantische zwaartekracht in het algemeen gedraagt zich vrij voorspelbaar zoals in de onderstaande grafiek te zien is. De symmetrie is hier echter een direct gevolg van onze meet methode (een schuivend window). Ook is de vorm van de grafiek vooral in beide staarten (aan de randen) vrij grillig. Deze grilligheid kan voor een deel verklaard worden uit een relatief gebrek aan data voor de staarten. Er is voor de eerste rechter en linker positie namelijk bijna tachtig maal zoveel data beschikbaar als voor de 49e posities. Desondanks hebben we het ook daar nog over 1233 semantische termen. Het lijkt dan ook niet ondenkbaar dat de kraters die we grofweg om de 9 posities zien optreden wel degelijk een eigenschap en regelmatigheid zijn van de semantische zwaartekracht. Deze zou mogelijkerwijs kunnen samenhangen met het constellatie effect waar Cantos en Sánchez op wezen, of met een grammaticale regelmatigheid. De algemene semantische zwaartekracht Het blijft onduidelijk hoe de krater in het midden verklaard kan worden, die ook hier optreedt, ondanks de normalisaties voor de in de vorige alinea besproken ruis factor en grammaticale oorzaken. Ze zou veroorzaakt kunnen worden door woorden die wel semantische termen zijn, maar toch een syntactische rol vervullen. Auxiliaries (zoals 'to be') zijn hier de primaire verdachte. Deze woorden hebben namelijk ook een betekenis op zichzelf, en worden onder die betekenis door WordNet

13 Wybo Wiersma Semantische Zwaartekracht 11 behandeld als semantische term, maar in hun syntactische rollen leveren deze termen natuurlijk veelal een zeer lage semantische gerelateerdheid op. Ongeacht hoe de krater ontstaat zolang ze een eigenschap is van de semantische relaties binnen de data betekent het bestaan er van wel dat het raadzaam zou kunnen zijn om een gat in het midden te laten bij windows die men voor semantische (IR ) doeleinden wil gebruiken. Afgaande op de bovenstaande grafiek lijkt een window van 8.. 2, 2..8 bijvoorbeeld geschikt. De algemene semantische zwaartekracht is in de volgende paragrafen steeds in grijs weergegeven als referentie kader, net als de loodlijn.

14 Wybo Wiersma Semantische Zwaartekracht 12 Nouns Zoals in de onderstaande grafiek te zien is, is de semantische zwaartekracht van zelfstandige naamwoorden duidelijk niet symmetrisch. Zelfstandige naamwoorden zijn over het algemeen veel sterker gerelateerd aan voorgaande woorden dan aan woorden die op hen volgen. Dit lijkt een situatie te zijn die niet alleen speelt op kleine afstanden van het zelfstandige naamwoord, maar die zich uitstrekt over bijna het hele window tot 48. Wel is het zo dat dit verschil binnen een window van veel groter is. Met name woorden direct na een zelfstandig naamwoord zijn er zelden mee gerelateerd, terwijl woorden tussen 5 en 3 meer gerelateerd zijn dan die op andere posities. Dit korte afstands effect kan verklaard worden uit de relatie met bijvoeglijke naamwoorden en vooruit wijzende werkwoorden. De sterkere relatie met voorgaande woorden over de lange afstand lijkt moeilijk verklaarbaar dan door aan te nemen dat zelfstandige naamwoorden dikwijls het sluitstuk vormen van een semantisch cluster. In algemene zin valt verder nog op te merken dat zelfstandige naamwoorden vaak lange afstands dragers lijken te zijn van de betekenis in een tekst. In elk geval vonden Cantos en Sánchez voor de twee termen letter en mano ook sterkere semantische relaties links dan rechts van deze termen, en tot op zeer grote afstanden (100+). De semantische zwaartekracht rond zelfstandige naamwoorden

15 Wybo Wiersma Semantische Zwaartekracht 13 Adjectives De bevindingen met betrekking tot bijvoeglijke naamwoorden zijn weinig verrassend en zeer helder. Bijvoeglijke naamwoorden hebben een zeer sterke semantische relatie met de woorden waarop ze betrekking hebben (waar ze vlak voor staan). Voor de overige posities zijn de semantische relaties vrij vlak verdeeld, afgezien van een iets kleinere relatie met woorden direct voorafgaand aan de bijvoeglijke naamwoorden. De semantische zwaartekracht rond bijvoeglijke naamwoorden

16 Wybo Wiersma Semantische Zwaartekracht 14 Verbs Werkwoorden laten de omgekeerde verhouding zien van die we aantreffen bij zelfstandige naamwoorden. De relatie met voorgaande semantische termen is over de hele linie minder dan die met de termen die er op volgen. Dichter rond de centrale term zijn de verhoudingen echter anders. Daar zien we ook sterke relaties binnen het window Wel dempt de grootte van de semantische relaties tussen positie 1 en 8 minder snel uit dan tussen 3 en 1. Over het geheel genomen lijkt de semantische zwaartekracht van werkwoorden het meest op de algemene semantische zwaartekracht, alleen is ze veel extremer. De semantische zwaartekracht rond werkwoorden

17 Wybo Wiersma Semantische Zwaartekracht 15 Adverbs Bijwoorden gedragen zich het meest zoals we dat ons naïef zouden voorstellen. Binnen een window van pakweg neemt de semantische zwaartekracht bijna symmetrisch af wanneer men verder van de centrale term verwijderd raakt. Van een krater is hier geen spoor. Ook is de invloed van posities op de semantische gerelateerdheid vrij vlak buiten dit domein. Wel lijkt er over het geheel genomen een iets grotere semantische aantrekkingskracht te bestaan met woorden die op de term volgen dan met die er aan voorafgaan. De afwezigheid van een krater zou gezien kunnen worden in het licht van het feit dat bijwoorden meestal zijn ingebed in een reeks van semantische termen en ze hierin de functie hebben van een bepaling die vaak erg semantisch van aard is. Bijwoorden worden vrijwel altijd gebruikt met geen ander doel dan een semantisch doel, in tegenstelling tot bijvoorbeeld hulpwerkwoorden. De semantische zwaartekracht rond bijwoorden

18 Wybo Wiersma Semantische Zwaartekracht 16 Auxiliaries Zoals te zien is, is de grafiek van hulpwerkwoorden uitermate grillig. Er is alleen een grote mate van semantische gerelateerdheid met termen op positie 2. Verder heeft de grafiek iets weg van die van werkwoorden, maar ontbreekt een echte piek links van de centrale term. Bovendien is en blijft grilligheid de meest kenmerkende eigenschap. Deze grilligheid zouden we kunnen verklaren vanuit het feit dat bijwoorden in het Engels meestal een puur syntactische functie hebben. In de vorm van 'he did walk', en 'he is walking', wordt de tijd van de er op volgende werkwoorden er mee aangepast, zonder dat er een directe semantische relatie is tussen 'to be' en 'to walk'. Wel is uit deze grafiek duidelijk dat de krater in de algemene semantische zwaartekracht en rond werkwoorden zeker niet alleen verklaard kan worden door het gedrag van hulpwerkwoorden.

19 Conclusie Wybo Wiersma Semantische Zwaartekracht 17 Al met al lijkt het meten van de semantische zwaartekracht vrij goed gelukt te zijn. De patronen die optreden zijn voor een groot deel zoals we deze zouden verwachten. Toch bleek het lastig om de verlaging van de algemene semantische zwaartekracht op posities 1 en 1 afdoende te verklaren. Hiervoor is een diepgaandere analyse noodzakelijk, waarbij hoogstwaarschijnlijk ook de data van de volledige ICE tagset betrokken zal moeten worden. Desondanks is wel aangetoond dat semantische zwaartekracht zich niet zo simpel gedraagt als bij veel window based IR technieken wordt voorondersteld. Ook zijn duidelijke verschillen gevonden in het gedrag van de semantische zwaartekracht rond verschillende POS tags. In een aantal gevallen waren deze verschillen ook nog duidelijk over langere (+ 10) afstanden. Vooral bij zelfstandige naamwoorden kon worden waargenomen dat semantische aantrekkingskracht ook buiten het normaal te verwachten bereik van grammaticale invloeden een rol van betekenis speelt. Vervolg onderzoek naar semantische zwaartekracht lijkt me al met al wel gerechtvaardigd. De belangrijkste verbetering in de methode die hierbij zinvol zou kunnen zijn is het bepalen van de statistische significantie van de bevindingen. Met name wanneer de specifiekere tags uit de volledige ICE tagset worden meegenomen zal dit nodig zijn, omdat er voor elk van die tags veel minder data is en dus een grotere kans op te weinig significantie. Ook zou het interessant kunnen zijn om, behalve op de POS tag van de centrale term, ook op die van de omliggende semantische termen te letten. Op die manier zou men precies kunnen onderzoeken hoe bijvoorbeeld de semantische relaties tussen alleen zelfstandige naamwoorden, of tussen werkwoorden en hulpwerkwoorden er uitzien. In elk geval ligt er bij een dergelijk vervolgproject de mogelijkheid om zowel de resultaten van veel varianten van window based IR te verbeteren, alsook om fundamenteel taalkundig onderzoek te doen. Voor IR lijkt het in elk geval interessant om te experimenteren met windows die rond het midden een gat hebben, zoals

20 Literatuurlijst Wybo Wiersma Semantische Zwaartekracht 18 Cantos, Pascual and Aquilino Sánchez, 'Lexical Constellations: What Collocates Fail to Tell', International Journal of Corpus Linguistics, vol 6, afl 2 (2001), Jin, Qianli, Jun Zhao et al., 'Window based Method for Information Retrieval', Lecture notes in computer science, vol 3248 (2005), Vechtomova, Olga, Stephen Robertson et al., 'Query Expansion with Long Span Collocates', Information Retrieval, vol 6, afl 2 (2003), Wiersma, Wybo, 'Tweak Test: van Sformula, WordNet, Naked Keywords & Random Retrieval', WyboWiermsa.pdf (2004).

De statespace van Small World Networks

De statespace van Small World Networks De statespace van Small World Networks Emiel Suilen, Daan van den Berg, Frank van Harmelen epsuilen@few.vu.nl, daanvandenberg1976@gmail.com, Frank.van.Harmelen@cs.vu.nl VRIJE UNIVERSITEIT AMSTERDAM 2 juli

Nadere informatie

SAMENVATTING Het doel van dit proefschrift is drieledig. Ten eerste wordt inzicht verschaft in het gebruik van directe-rede-constructies (bijvoorbeeld Marie zei: Kom, we gaan! ) door sprekers met afasie.

Nadere informatie

Cover Page. The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation.

Cover Page. The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation. Cover Page The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation. Author: Witsenburg, Tijn Title: Hybrid similarities : a method to insert relational information

Nadere informatie

WHITEPAPER Sentiment Analyse

WHITEPAPER Sentiment Analyse WHITEPAPER Sentiment Analyse We creëren tegenwoordig In 2 dagen tijd net zoveel data als dat we deden vanaf het ontstaan van de beschaving tot en met 2003. Ruim 88% van die data is Dark Data. Wikipedia

Nadere informatie

Tellen met Taal. Het meten van variatie in zinsbouw in Nederlandse dialecten. Marco René Spruit

Tellen met Taal. Het meten van variatie in zinsbouw in Nederlandse dialecten. Marco René Spruit Tellen met Taal Het meten van variatie in zinsbouw in Nederlandse dialecten Marco René Spruit Taalkundige afstand Iedereen weet dat de afstand tussen Amsterdam en Utrecht kleiner is dan de afstand tussen

Nadere informatie

Een hele eenvoudige benadering van de oplossing van dit probleem die men wel voorgesteld heeft, is de volgende regel:

Een hele eenvoudige benadering van de oplossing van dit probleem die men wel voorgesteld heeft, is de volgende regel: Accent op voorzetsels en partikels Het tweede probleem dat ik wil gebruiken ter illustratie is een probleem dat meer van belang is voor de spraaktechnologie. Een van de technologieën die spraaktechnologen

Nadere informatie

Tweak-Test van Sformula, WordNet, Naked Keywords & Random Retrieval

Tweak-Test van Sformula, WordNet, Naked Keywords & Random Retrieval Eindwerkstuk voor Corpustaalkunde: Tweak-Test van Sformula, WordNet, Naked Keywords & Random Retrieval Wybo Wiersma, 1298577 Inhoudsopgave: Inleiding:...1 Onderzoeksopzet: Waar naartoe, Waarvandaan...1

Nadere informatie

Het sem metrix. metrix-project. De profielgebaseerde meting van lexicale. University of Leuven RU Quantitative Lexicology and Variational Linguistics

Het sem metrix. metrix-project. De profielgebaseerde meting van lexicale. University of Leuven RU Quantitative Lexicology and Variational Linguistics Het sem metrix metrix-project De profielgebaseerde meting van lexicale variatie op een grotere schaal Kris Heylen & Yves Peirsman University of Leuven RU Quantitative Lexicology and Variational Linguistics

Nadere informatie

Samenvatting De belangrijkste onderzoeksvraag waarop het werk in dit proefschrift een antwoord probeert te vinden, is welke typen taalkundige informatie het nuttigst zijn voor de lexicale desambiguatie

Nadere informatie

Cover Page. The handle holds various files of this Leiden University dissertation.

Cover Page. The handle  holds various files of this Leiden University dissertation. Cover Page The handle http://hdl.handle.net/1887/29764 holds various files of this Leiden University dissertation. Author: Takes, Frank Willem Title: Algorithms for analyzing and mining real-world graphs

Nadere informatie

Populaties beschrijven met kansmodellen

Populaties beschrijven met kansmodellen Populaties beschrijven met kansmodellen Prof. dr. Herman Callaert Deze tekst probeert, met voorbeelden, inzicht te geven in de manier waarop je in de statistiek populaties bestudeert. Dat doe je met kansmodellen.

Nadere informatie

The expression of modifiers and arguments in the noun phrase and beyond van Rijn, M.A.

The expression of modifiers and arguments in the noun phrase and beyond van Rijn, M.A. UvA-DARE (Digital Academic Repository) The expression of modifiers and arguments in the noun phrase and beyond van Rijn, M.A. Link to publication Citation for published version (APA): van Rijn, M. A. (2017).

Nadere informatie

Vaardigheden van Nederlandse leraren taal, rekenen, problemen oplossen

Vaardigheden van Nederlandse leraren taal, rekenen, problemen oplossen Vaardigheden van Nederlandse leraren taal, rekenen, problemen oplossen Bart Golsteyn Maastricht University School of Business and Economics Onderwijseconomie Achtergrond Leraren spelen een cruciale rol

Nadere informatie

De Grids van het Actueel Hoogtebestand Nederland

De Grids van het Actueel Hoogtebestand Nederland Ministerie van Verkeer en Waterstaat jklmnopq Adviesdienst Geo-informatie en ICT De Grids van het Actueel Hoogtebestand Nederland Versie 1.3 28 januari 2004 Ministerie van Verkeer en Waterstaat jklmnopq

Nadere informatie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Virtuele Markten Trading Agent Competition

Virtuele Markten Trading Agent Competition Virtuele Markten Trading Agent Competition A smart trading agent Erik Kant (0122246) en Marten Kampman (0240478), 9 november 2007 Naar aanleiding van de Trading Agent Competition voor het vak Virtuele

Nadere informatie

Instructie voor Docenten. Hoofdstuk 13 OMTREK EN OPPERVLAKTE

Instructie voor Docenten. Hoofdstuk 13 OMTREK EN OPPERVLAKTE Instructie voor Docenten Hoofdstuk 13 OMTREK EN OPPERVLAKTE Instructie voor docenten H13: OMTREK EN OPPERVLAKTE DOELEN VAN DIT HOOFDSTUK: Leerlingen weten wat de begrippen omtrek en oppervlakte betekenen.

Nadere informatie

Research Note Prestatie-analyse met behulp van box plots

Research Note Prestatie-analyse met behulp van box plots Research Note Prestatie-analyse met behulp van box plots Inleiding Voortdurend worden er wereldwijd enorme hoeveelheden beursdata gegenereerd en verzameld. Dit is mede te danken aan de opkomst van internet

Nadere informatie

automatische zoekverbetering

automatische zoekverbetering automatische zoekverbetering taaltechnologische technieken Eric Sieverts VOGIN HvA / december 2012 (taal)technologische methoden best-match zoeken met relevantie-ordening truncatie, wordstemming, fuzzy

Nadere informatie

Rekenen: Meten groep 4 en hoger. Het leren van simpele weegopdrachten.

Rekenen: Meten groep 4 en hoger. Het leren van simpele weegopdrachten. Activiteit 7 Lichtste en zwaarste Sorteer algoritmes Samenvatting Computers worden vaak gebruikt om lijsten in een bepaalde volgorde te zetten, bijvoorbeeld namen in alfabetische volgorde, e-mails of afspraken

Nadere informatie

Bijzondere kettingbreuken

Bijzondere kettingbreuken Hoofdstuk 15 Bijzondere kettingbreuken 15.1 Kwadratische getallen In het vorige hoofdstuk hebben we gezien dat 2 = 1, 2, 2, 2, 2, 2, 2,.... Men kan zich afvragen waarom we vanaf zeker moment alleen maar

Nadere informatie

NLP technieken voor Question Answering

NLP technieken voor Question Answering NLP technieken voor Question Answering College Natuurlijke Taalinterfaces Januari 2003 1 Question Answering Vraag: Door wie werd WebTV Networks overgenomen? Antwoord is een (deel van een zin)uit een document:

Nadere informatie

De wijde wereld in wandelen

De wijde wereld in wandelen 127 De wijde wereld in wandelen Valrisico schatten door het meten van lopen in het dagelijks leven Om een stap verder te komen in het schatten van valrisico heb ik het lopen in het dagelijks leven bestudeerd.

Nadere informatie

Continuous Learning in Computer Vision S.L. Pintea

Continuous Learning in Computer Vision S.L. Pintea Continuous Learning in Computer Vision S.L. Pintea Continuous Learning in Computer Vision Natura non facit saltus. Gottfried Leibniz Silvia-Laura Pintea Intelligent Sensory Information Systems University

Nadere informatie

Laagfrequent geluidshinder klacht woning Losser

Laagfrequent geluidshinder klacht woning Losser Laagfrequent geluidshinder klacht woning Losser Meting uitgevoerd door: Axel Lok (Universiteit Twente) Datum: 27 november 2015 Inleiding Naar aanleiding van een laagfrequent geluidsklacht is er een geluid

Nadere informatie

Normering en schaallengte

Normering en schaallengte Bron: www.citogroep.nl Welk cijfer krijg ik met mijn score? Als je weet welke score je ongeveer hebt gehaald, weet je nog niet welk cijfer je hebt. Voor het merendeel van de scores wordt het cijfer bepaald

Nadere informatie

IMPRESSIE ICT BENCHMARK GEMEENTEN 2011

IMPRESSIE ICT BENCHMARK GEMEENTEN 2011 IMPRESSIE ICT BENCHMARK GEMEENTEN 2011 Sparrenheuvel, 3708 JE Zeist (030) 2 270 500 offertebureau@mxi.nl www.mxi.nl Inhoudsopgave 1 Inleiding 3 1.1 Zevende ronde ICT Benchmark Gemeenten 2011 3 1.2 Waarom

Nadere informatie

Rekenen aan wortels Werkblad =

Rekenen aan wortels Werkblad = Rekenen aan wortels Werkblad 546121 = Vooraf De vragen en opdrachten in dit werkblad die vooraf gegaan worden door, moeten schriftelijk worden beantwoord. Daarbij moet altijd duidelijk zijn hoe de antwoorden

Nadere informatie

Samenvatting Impliciet leren van kunstmatige grammatica s: Effecten van de complexiteit en het nut van de structuur

Samenvatting Impliciet leren van kunstmatige grammatica s: Effecten van de complexiteit en het nut van de structuur Samenvatting Impliciet leren van kunstmatige grammatica s: Effecten van de complexiteit en het nut van de structuur Hoewel kinderen die leren praten geen moeite lijken te doen om de regels van hun moedertaal

Nadere informatie

Samenvatting De hoofdonderzoeksvraag van dit proefschrift is vast te stellen hoe term- en relatie-extractietechnieken kunnen bijdragen tot het beantwoorden van medische vragen. Deze vraag is ingegeven

Nadere informatie

Transparency in Language: A Typological Study S.C. Leufkens

Transparency in Language: A Typological Study S.C. Leufkens Transparency in Language: A Typological Study S.C. Leufkens Transparency in language. A typological study Sterre Leufkens Een taal kun je zien als een verzameling vormen (woorden, zinnen, klanken, regels),

Nadere informatie

Information Retrieval: introductie 1

Information Retrieval: introductie 1 Information Retrieval: introductie 1 hoe is relevante informatie in zeer grote hoveelheden van documenten te vinden? deze documenten moeten wel door de computer verwerkbaar zijn vaak zijn er te veel hits:

Nadere informatie

8. Analyseren van samenhang tussen categorische variabelen

8. Analyseren van samenhang tussen categorische variabelen 8. Analyseren van samenhang tussen categorische variabelen Er bestaat een samenhang tussen twee variabelen als de verdeling van de respons (afhankelijke) variabele verandert op het moment dat de waarde

Nadere informatie

Folkert Buiter 2 oktober 2015

Folkert Buiter 2 oktober 2015 1 Nuchter kijken naar feiten en trends van aardbevingen in Groningen. Een versneld stijgende lijn van het aantal en de kracht van aardbevingen in Groningen. Hoe je ook naar de feitelijke metingen van de

Nadere informatie

Stakeholder behoeften beschrijven binnen Togaf 9

Stakeholder behoeften beschrijven binnen Togaf 9 Stakeholder behoeften beschrijven binnen Togaf 9 Inventarisatie van concerns, requirements, principes en patronen Bert Dingemans Togaf 9 kent verschillende entiteiten om de behoeften van stakeholders te

Nadere informatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch

Nadere informatie

Mastermind met acht kleuren

Mastermind met acht kleuren Geschreven voor het vak: Wiskunde gedoceerd door H. Mommaerts Onderzoekscompetentie Mastermind met acht kleuren Auteurs: Tom Demeulemeester Pieter Van Walleghem Thibaut Winters 6LWIi 22 april 2014 1 Inleiding

Nadere informatie

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R 14. Herhaalde metingen Introductie Bij herhaalde metingen worden er bij verschillende condities in een experiment dezelfde proefpersonen gebruikt of waarbij dezelfde proefpersonen op verschillende momenten

Nadere informatie

FESLI. Gebruikershandleiding. Gebruikershandleiding bij de FESLI web applicatie CLARIN-NL

FESLI. Gebruikershandleiding. Gebruikershandleiding bij de FESLI web applicatie CLARIN-NL CLARIN-NL FESLI Gebruikershandleiding Gebruikershandleiding bij de FESLI web applicatie M e e r t e n s I n s t i t u u t, J o a n M u y s k e n s w e g 2 5, 1 0 9 6 C J A m s t e r d a m Gebruikershandleiding

Nadere informatie

Oplossingen Datamining 2II15 Juni 2008

Oplossingen Datamining 2II15 Juni 2008 Oplossingen Datamining II1 Juni 008 1. (Associatieregels) (a) Zijn de volgende beweringen juist of fout? Geef een korte verklaring voor alle juiste beweringen en een tegenvoorbeeld voor alle foute be-weringen:

Nadere informatie

n-queens minimale dominantie verzamelingen Chessboard Domination on Programmable Graphics Hardware door Nathan Cournik

n-queens minimale dominantie verzamelingen Chessboard Domination on Programmable Graphics Hardware door Nathan Cournik n-queens minimale dominantie verzamelingen Chessboard Domination on Programmable Graphics Hardware door Nathan Cournik Rick van der Zwet 4 augustus 2010 Samenvatting Dit schrijven zal

Nadere informatie

Kernbegrippen Handig met getallen 1, onderdeel Bewerkingen

Kernbegrippen Handig met getallen 1, onderdeel Bewerkingen Kernbegrippen Handig met getallen 1, onderdeel Bewerkingen 1.12 Kernbegrippen van de Kennisbasis Hele getallen, onderdeel Bewerkingen Aftrekker De aftrekker in een aftreksom is het getal dat aangeeft hoeveel

Nadere informatie

Ieder tweetal heeft nodig: Een kopie van de slagschipspelletjes: 1. 1A, 1B voor spel A, 2B voor spel A, 3B voor spel 3

Ieder tweetal heeft nodig: Een kopie van de slagschipspelletjes: 1. 1A, 1B voor spel A, 2B voor spel A, 3B voor spel 3 Activiteit 6 Slagschepen Zoekalgoritme Samenvatting Computers zijn vaak nodig om informatie te vinden in grote hoeveelheden data. Ze moeten een snelle en efficiënte manier ontwikkelen om dit te doen. Deze

Nadere informatie

Informatie & Databases

Informatie & Databases Informatie Wat is informatie en waaruit het bestaat? Stel op een kaart staat het getal 37 geschreven. Wat kun je dan zeggen van het cijfer 37? Niets bijzonders, toch? Alleen dat het een getal is. Gaat

Nadere informatie

Wat maakt WizeNote uniek?

Wat maakt WizeNote uniek? wizenote Wat maakt WizeNote uniek? Het belang van begrijpelijk schrijven Online informatie is vaak veel te moeilijk. Op basis van veel onderzoek is onze schatting dat 80% van de zakelijke teksten geschreven

Nadere informatie

Project: Kennisdocument Onderwerp: p90 Datum: 23 november 2009 Referentie: p90 onzekerheid Wat betekent de p90 (on)zekerheid?

Project: Kennisdocument Onderwerp: p90 Datum: 23 november 2009 Referentie: p90 onzekerheid Wat betekent de p90 (on)zekerheid? Project: Kennisdocument Onderwerp: p90 Datum: 23 november 2009 Referentie: p90 onzekerheid Wat betekent de p90 (on)zekerheid? De p90 onzekerheid staat in het kader van de garantieregeling voor aardwarmte

Nadere informatie

Summary in Dutch 179

Summary in Dutch 179 Samenvatting Een belangrijke reden voor het uitvoeren van marktonderzoek is het proberen te achterhalen wat de wensen en ideeën van consumenten zijn met betrekking tot een produkt. De conjuncte analyse

Nadere informatie

Hoofdstuk 21: Gegevens samenvatten

Hoofdstuk 21: Gegevens samenvatten Hoofdstuk 21: Gegevens samenvatten 21.0 Inleiding In Excel kunnen grote (en zelfs ook niet zo grote) tabellen met getallen en tekst er nogal intimiderend uitzien. Echter, Excel komt helemaal tot haar recht

Nadere informatie

Hoofdstuk 1 Spiegelen in lijn en in cirkel. Eigenschappen.

Hoofdstuk 1 Spiegelen in lijn en in cirkel. Eigenschappen. Hoofdstuk 1 Spiegelen in lijn en in cirkel. Eigenschappen. Jakob Steiner (Utzenstorf (kanton Bern), 18 maart 1796 - Bern, 1 april 1863) was een Zwitsers wiskundige. Hij wordt beschouwd als een van de belangrijkste

Nadere informatie

Marktscan Digikoppeling 2017

Marktscan Digikoppeling 2017 Testrapport Marktscan Digikoppeling 2017 Versie: 1.0 Datum: 18-6-2015 Auteur: egem Datum : 2 juni 2017 Versie : 1.0 Inhoudsopgave 1. Inleiding... 2 2. Managementsamenvatting... 3 3. Testopzet... 4 3.1

Nadere informatie

Eindexamen wiskunde A havo 2011 - I

Eindexamen wiskunde A havo 2011 - I Zuinig rijden Tijdens rijlessen leer je om in de auto bij foto 20 km per uur van de eerste naar de tweede versnelling te schakelen. Daarna ga je bij 40 km per uur naar de derde versnelling, bij 60 km per

Nadere informatie

Taaljournaal Leerlijnenoverzicht - Lezen

Taaljournaal Leerlijnenoverzicht - Lezen Taaljournaal Leerlijnenoverzicht - Lezen 1.1 Eigen kennis 1.1.1 Kinderen kunnen hun eigen kennis activeren, m.a.w. ze kunnen aangeven wat ze over een bepaald onderwerp al weten en welke ervaringen ze er

Nadere informatie

Starten van de tool De tool wordt opgestart door een web browser te openen (bij voorkeur Google Chrome) en in de adresbalk te typen:

Starten van de tool De tool wordt opgestart door een web browser te openen (bij voorkeur Google Chrome) en in de adresbalk te typen: Gist demo Toelichting op de interface en werking van de tool. v0.1, 20 januari 2016, Erik Boertjes v0.2, 1 februari 2016, Rianne Kaptein v0.3, 9 mei 2016, Rianne Kaptein Doel Met behulp van de tool beschreven

Nadere informatie

Combinatorische Algoritmen: Binary Decision Diagrams, Deel III

Combinatorische Algoritmen: Binary Decision Diagrams, Deel III Combinatorische Algoritmen: Binary Decision Diagrams, Deel III Sjoerd van Egmond LIACS, Leiden University, The Netherlands svegmond@liacs.nl 2 juni 2010 Samenvatting Deze notitie beschrijft een nederlandse

Nadere informatie

P l u r a l i t e i t Hoorcollege Semantiek 28 maart 2012

P l u r a l i t e i t Hoorcollege Semantiek 28 maart 2012 P l u r a l i t e i t Hoorcollege Semantiek 28 maart 2012 Enkelvoud en meervoud in de morfosyntaxis: (1) a. Het meisje lacht/*lachen. b. De meisjes *lacht/lachen. c. Tina lacht/*lachen en Lotte lacht/*lachen.

Nadere informatie

Definitie 1.1. Een partitie van een natuurlijk getal n is een niet stijgende rij positieve natuurlijke getallen met som n

Definitie 1.1. Een partitie van een natuurlijk getal n is een niet stijgende rij positieve natuurlijke getallen met som n Hoofdstuk 1 Inleidende begrippen 1.1 Definities Definitie 1.1. Een partitie van een natuurlijk getal n is een niet stijgende rij positieve natuurlijke getallen met som n Voor het tellen van het aantal

Nadere informatie

Informatie ophalen uit het Alfabet

Informatie ophalen uit het Alfabet Informatie ophalen uit het Alfabet Anton Wijbenga (antonw@ai.rug.nl) Rijksuniversiteit Groningen, Afdeling Kunstmatige Intelligentie; Grote Kruisstraat 2/1, 9712 TS Groningen Abstract Er zijn verschillende

Nadere informatie

Centraal Bureau voor de Statistiek TOELICHTING CONJUNCTUURKLOKINDICATOR. Floris van Ruth

Centraal Bureau voor de Statistiek TOELICHTING CONJUNCTUURKLOKINDICATOR. Floris van Ruth Centraal Bureau voor de Statistiek Divisie Macro-Economische Statistieken en Publicaties Sector Ontwikkeling en Ondersteuning TOELICHTING CONJUNCTUURKLOKINDICATOR Floris van Ruth Augustus 009 Achtergrond

Nadere informatie

Samenvatting Zoeken naar en leren begrijpen van speciale woorden Herkenning en de interpretatie van metaforen door schoolkinderen

Samenvatting Zoeken naar en leren begrijpen van speciale woorden Herkenning en de interpretatie van metaforen door schoolkinderen Samenvatting Zoeken naar en leren begrijpen van speciale woorden Herkenning en de interpretatie van metaforen door schoolkinderen Onderzoek naar het gebruik van metaforen door kinderen werd populair in

Nadere informatie

Uitleg van de Hough transformatie

Uitleg van de Hough transformatie Uitleg van de Hough transformatie Maarten M. Fokkinga, Joeri van Ruth Database groep, Fac. EWI, Universiteit Twente Versie van 17 mei 2005, 10:59 De Hough transformatie is een wiskundige techniek om een

Nadere informatie

Magidoku s en verborgen symmetrieën

Magidoku s en verborgen symmetrieën Uitwerking Puzzel 92-6 Magidoku s en verborgen symmetrieën Wobien Doyer Lieke de Rooij Een Latijns vierkant van orde n, is een vierkante matrix, gevuld met n verschillende symbolen waarvan elk precies

Nadere informatie

Witte Dakcoating Höften Strakschilders

Witte Dakcoating Höften Strakschilders Witte Dakcoating Höften Strakschilders Eindrapport In opdracht van: Enschede, 25 mei 2012 Avante Consultancy www.avanteconsultancy.nl Colofon Opdrachtgever Pioneering Mevr. J. Bults M.H. Tromplaan 28 7513

Nadere informatie

Netwerkdiagram voor een project. AON: Activities On Nodes - activiteiten op knooppunten

Netwerkdiagram voor een project. AON: Activities On Nodes - activiteiten op knooppunten Netwerkdiagram voor een project. AON: Activities On Nodes - activiteiten op knooppunten Opmerking vooraf. Een netwerk is een structuur die is opgebouwd met pijlen en knooppunten. Bij het opstellen van

Nadere informatie

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 22 april 2010 1 1 Introductie De

Nadere informatie

Uitvoering advies aanlevering beleidsinformatie Veilig Thuis

Uitvoering advies aanlevering beleidsinformatie Veilig Thuis Uitvoering advies aanlevering beleidsinformatie Veilig Thuis 8 juni 2015 1 ADVIES De Wmo2015 verplicht de Veilig Thuis organisaties (VT organisaties) om twee keer per jaar, in juli en januari) bij CBS

Nadere informatie

Slangennest Wiskunde B-dag 2018

Slangennest Wiskunde B-dag 2018 Slangennest Wiskunde B-dag 2018 2 Basisopgaven Opgave 1: Cirkeldekens (a) Het kleinste geschikte cirkelvormige dekentje heeft een diameter van 15 cm. (b) Slangen die voldoende om de kop heen krullen passen

Nadere informatie

? 50. Som-som puzzels: meer dan zomaar leuk! ?? 17 ?? 27. c 3 10

? 50. Som-som puzzels: meer dan zomaar leuk! ?? 17 ?? 27. c 3 10 Som-som puzzels: meer dan zomaar leuk! 30 75 85? 50 35 75 75 20 Som-som puzzels behoren tot de categorie waarbij een raamwerk is omgeven door getallen. Bij somsom puzzels speelt logisch denken een rol.

Nadere informatie

Cover Page. The handle holds various files of this Leiden University dissertation.

Cover Page. The handle   holds various files of this Leiden University dissertation. Cover Page The handle http://hdl.handle.net/1887/62814 holds various files of this Leiden University dissertation. Author: Martindale, C.R. Title: Isogeny graphs, modular polynomials, and applications

Nadere informatie

Transfer en toegang tot Universele Grammatica in tweedetaalverwerving door volwassenen

Transfer en toegang tot Universele Grammatica in tweedetaalverwerving door volwassenen Samenvatting Transfer en toegang tot Universele Grammatica in tweedetaalverwerving door volwassenen Negen casestudies naar de verwerving van het Engels, Duits en Zweeds door volwassen moedertaalsprekers

Nadere informatie

9. Strategieën en oplossingsmethoden

9. Strategieën en oplossingsmethoden 9. Strategieën en oplossingsmethoden In dit hoofdstuk wordt nog even terug gekeken naar alle voorgaande hoofdstukken. We herhalen globaal de structuren en geven enkele richtlijnen voor het ontwerpen van

Nadere informatie

Vragen. Terugkomcursus Met Sprongen Vooruit groep 3 en 4

Vragen. Terugkomcursus Met Sprongen Vooruit groep 3 en 4 Vragen Terugkomcursus Met Sprongen Vooruit groep 3 en 4 Inhoudsopgave blz. Oefenonderdelen Leren tellen 2 Ordenen en lokaliseren 3 Springen naar getallen 4 Aanvullen tot 10 5 Splitsingen 6 Sprong van 10

Nadere informatie

Cover Page. The handle holds various files of this Leiden University dissertation.

Cover Page. The handle  holds various files of this Leiden University dissertation. Cover Page The handle http://hdl.handle.net/1887/29991 holds various files of this Leiden University dissertation. Author: Sun, Hongyuan Title: Temporal construals of bare predicates in Mandarin Chinese

Nadere informatie

Question Answering. College Natuurlijke Taalinterfaces. Januari 2002

Question Answering. College Natuurlijke Taalinterfaces. Januari 2002 Question Answering College Natuurlijke Taalinterfaces Januari 2002 1 Information Retrieval, Web Search Zoek relevante documenten over een bepaald onderwerp. Vraag: keywords (en boolese connectieven), Bin

Nadere informatie

Aanpassing te reserveren biedladder middelen

Aanpassing te reserveren biedladder middelen Aanpassing te reserveren biedladder middelen Door Walter F. Crommelin Afdeling Gastransport Planning Rapport Aanpassing te reserveren hoeveelheid biedladder capaciteit Gereed 15 januari 2013 Document Document1

Nadere informatie

DEC SDR DSP project 2017 (2)

DEC SDR DSP project 2017 (2) DEC SDR DSP project 2017 (2) Inhoud: DSP software en rekenen Effect van type getallen (integer, float) Fundamenten onder DSP Lezen van eenvoudige DSP formules x[n] Lineariteit ( x functie y dus k maal

Nadere informatie

Extra opdrachten met het zinsbouwpakket. Bijlage bij het Basisboek syntaxis

Extra opdrachten met het zinsbouwpakket. Bijlage bij het Basisboek syntaxis Extra opdrachten met het zinsbouwpakket Bijlage bij het Basisboek syntaxis 1 Hoofdstuk 1: 1. De volgende opdrachten kun je alleen uitvoeren als je het zinsbouwpakket hebt. a. Zoek het puzzelstukje 'wolf'

Nadere informatie

Semantic Versus Lexical Gender M. Kraaikamp

Semantic Versus Lexical Gender M. Kraaikamp Semantic Versus Lexical Gender M. Kraaikamp Samenvatting Semantisch versus lexicaal geslacht: synchrone en diachrone variatie in Germaanse geslachtscongruentie De meeste Germaanse talen, waaronder het

Nadere informatie

3D PRINTING FABRICS, TEXTILES AND CHAINMAIL

3D PRINTING FABRICS, TEXTILES AND CHAINMAIL 3D PRINTING FABRICS, TEXTILES AND CHAINMAIL Filament Material Feed Heated Filament Nozzle Printed Object Buildplate Heating Element Buildplate Printed Object Resin Reservoir Resin UV-Laser Mirror Resin

Nadere informatie

Samenvatting. A. van Leeuwenhoeklaan MA Bilthoven Postbus BA Bilthoven KvK Utrecht T

Samenvatting. A. van Leeuwenhoeklaan MA Bilthoven Postbus BA Bilthoven   KvK Utrecht T A. van Leeuwenhoeklaan 9 3721 MA Bilthoven Postbus 1 3720 BA Bilthoven www.rivm.nl KvK Utrecht 30276683 T 030 274 91 11 info@rivm.nl Uw kenmerk Gevoeligheid van de gesommeerde depositiebijdrage onder 0,05

Nadere informatie

Nu een leuk stukje wiskunde ter vermaak (hoop ik dan maar). Optellen van oneindig veel getallen

Nu een leuk stukje wiskunde ter vermaak (hoop ik dan maar). Optellen van oneindig veel getallen Nu een leuk stukje wiskunde ter vermaak (hoop ik dan maar). Optellen van oneindig veel getallen Ter inleiding: tellen Turven, maar: onhandig bij grote aantallen. Romeinse cijfers: speciale symbolen voor

Nadere informatie

Opinion Mining. Johan Stortelder s Onderzoeksplan masterscriptie. Mei 2006

Opinion Mining. Johan Stortelder s Onderzoeksplan masterscriptie. Mei 2006 Onderzoeksplan masterscriptie Mei 2006 Johan Stortelder s0355593 johanstortelder@student.ru.nl Probleemstelling Inleiding is een methode waarmee automatisch meningen (opinies) uit teksten kunnen worden

Nadere informatie

: een wiskundige uitdaging

: een wiskundige uitdaging Wiskunde & Onderwijs 38ste jaargang (2012) 125 125 : een wiskundige uitdaging Cesar Demeester Ik ben leraar wiskunde in het 2de jaar van de 1ste graad aan het Koninklijk Atheneum Pitzemburg te Mechelen.

Nadere informatie

Het blijkt dat dit eigenlijk alleen lukt met de exponentiële methode.

Het blijkt dat dit eigenlijk alleen lukt met de exponentiële methode. Verificatie Shen en Carpenter RDEC methodiek voor de karakterisering van asfaltvermoeiing; vergelijking van verschillende methoden voor het berekenen van de parameters. Jan Telman, Q-Consult Bedrijfskundig

Nadere informatie

Eigen vaardigheid Taal

Eigen vaardigheid Taal Eigen vaardigheid Taal Door middel van het beantwoorden van de vragen in dit blok heeft u inzicht gekregen in uw kennis en vaardigheden van de grammatica en spelling van de Nederlandse taal. In het overzicht

Nadere informatie

Inleiding: Combinaties

Inleiding: Combinaties Zinnen 1 Inleiding: Combinaties Combinaties op verschillende niveaus: Lettergrepen als combinaties van fonemen. Woorden als combinaties van morfemen. Zinnen als combinaties van woorden en woordgroepen.

Nadere informatie

Release notes. Versie 2.3

Release notes. Versie 2.3 DEFINITIES EN TELRICHTLIJNEN VOOR DE TOEPASSING VAN FUNCTIEPUNTANALYSE Release notes Versie 2.3 nesma.org VOORWOORD 1 VOORWOORD In 2005 werden de Nesma FPA telrichtlijnen verheven tot de Internationale

Nadere informatie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

11. Deelopdracht 8: Invloed stress op gezondheid

11. Deelopdracht 8: Invloed stress op gezondheid 11. Deelopdracht 8: Invloed stress op gezondheid Om te kijken naar een verband tussen stress en een ander gezondheidsaspect is er een vragenlijst afgenomen bij de mensen die de stresstest gedaan hebben.

Nadere informatie

Cover Page. The handle holds various files of this Leiden University dissertation.

Cover Page. The handle  holds various files of this Leiden University dissertation. Cover Page The handle http://hdl.handle.net/1887/20984 holds various files of this Leiden University dissertation. Author: Hosono, Mayumi Title: Object shift in the Scandinavian languages : syntax, information

Nadere informatie

Verschillenanalyse effect nieuwe BKR. Samenvatting. Inleiding. datum Directie Kinderopvang, Ministerie SZW. aan

Verschillenanalyse effect nieuwe BKR. Samenvatting. Inleiding. datum Directie Kinderopvang, Ministerie SZW. aan Verschillenanalyse effect nieuwe BKR datum 15-8-2018 aan van Directie Kinderopvang, Ministerie SZW Lucy Kok en Tom Smits, SEO Economisch Onderzoek Rapportnummer 2018-78 Copyright 2018 SEO Amsterdam. Alle

Nadere informatie

nederlandse samenvatting Dutch summary

nederlandse samenvatting Dutch summary Dutch summary 211 dutch summary De onderzoeken beschreven in dit proefschrift zijn onderdeel van een grootschalig onderzoek naar individuele verschillen in algemene cognitieve vaardigheden. Algemene cognitieve

Nadere informatie

PROJECTNUMMER D ONZE REFERENTIE D

PROJECTNUMMER D ONZE REFERENTIE D ONDERWERP Samenvatting Akoestisch onderzoek Zevenaar-Didam-Wehl DATUM 25-8-2016 PROJECTNUMMER D02131.000095 ONZE REFERENTIE 078983752 D VAN Johan Christen AAN ProRail Het spoortraject Arnhem-Winterswijk

Nadere informatie

VEEL CROSS-SECTORALE INNOVATIES IN DE REGIO GRONINGEN ASSEN

VEEL CROSS-SECTORALE INNOVATIES IN DE REGIO GRONINGEN ASSEN VEEL CROSS-SECTORALE INNOVATIES IN DE REGIO GRONINGEN ASSEN De meeste innovaties ontstaan buiten de traditionele sectoren. Dat is de opvallendste uitkomst van de Regioanalyse die in opdracht van de Regio

Nadere informatie

Impactanalyse DOT Honorariumtarieven

Impactanalyse DOT Honorariumtarieven Conceptrapportage ten behoeve van klankbordgroep 6 Impactanalyse DOT Honorariumtarieven Deel 2 Versie 1, 5 augustus 2011 Inhoud 1. Inleiding 5 2. Doelstelling 5 3. Referentie voor beoordeling 6 4. Onderzoeksopzet

Nadere informatie

Onderzoek naar het hulpwerkwoord OP

Onderzoek naar het hulpwerkwoord OP Onderzoek naar het hulpwerkwoord OP Inleiding In 2010 is het Nederlandse Gebarencentrum een onderzoek gestart naar hulpwerkwoorden (auxilaries) binnen de Nederlandse Gebarentaal (NGT). In de Nederlandse

Nadere informatie

Naam: Mijn doelenboekje. Grammatica. Werelden - Eilanden - Dorpen 5 / 6 / 7 / 8.

Naam: Mijn doelenboekje. Grammatica. Werelden - Eilanden - Dorpen 5 / 6 / 7 / 8. Naam: Mijn doelenboekje Grammatica Werelden - Eilanden - Dorpen 5 / 6 / 7 / 8 www.gynzy.com Inhoud & Legenda In dit doelenboekje zijn de volgende Werelden te vinden: Taalkundige ontleding...3 Redekundige

Nadere informatie

ProjectHeatmap. Onderzoeksrapport v0.5 11-03-11 Dennis Wagenaar

ProjectHeatmap. Onderzoeksrapport v0.5 11-03-11 Dennis Wagenaar ProjectHeatmap Onderzoeksrapport v0.5 11-03-11 Dennis Wagenaar 1 Inhoudsopgave Inleiding...3 Gheat...4 Info...4 Voordelen...4 Nadelen...4 Google Fusion Tables...5 Info...5 Voordelen...5 Nadelen...5 OLHeatmap...6

Nadere informatie

Drie maal taal. Taal beschouwen in realistische situaties

Drie maal taal. Taal beschouwen in realistische situaties Ronde 3 Joost Hillewaere Eekhoutcentrum Contact: joost.hillewaere@kuleuven-kulak.be Drie maal taal. Taal beschouwen in realistische situaties 1. Inleiding Waarom leren kinderen taal op school? Taal heeft

Nadere informatie

De Riemann-hypothese

De Riemann-hypothese De Riemann-hypothese Lars van den Berg 3 september 202 Laat ik je gelijk enthousiast maken om dit stukje te lezen: wie de Riemannhypothese oplost wint een miljoen. Wel zijn er waarschijnlijk eenvoudigere

Nadere informatie

Een voorbeeldopgave: Ik geef de hond te eten. Wat is de? Een werkwoord, een lidwoord, een zelfstandig

Een voorbeeldopgave: Ik geef de hond te eten. Wat is de? Een werkwoord, een lidwoord, een zelfstandig Bij alle spellen in Taalzee moeten de opgaven binnen een bepaalde tijd opgelost worden. Bij de meeste spellen is dat 20 seconden. Alle spellen bevatten opgaven die variëren van heel makkelijk tot heel

Nadere informatie