Question Answering. College Natuurlijke Taalinterfaces. Januari 2002

Vergelijkbare documenten
Overzicht. Informatie Extractie met Reguliere Expressies. Information Retrieval, Web Search. Web Search (Information Retrieval)

NLP technieken voor Question Answering

Off-line answer extraction for Question Answering Mur, Jori

automatische zoekverbetering

class book I am reading a book. close your books homework My teacher gave me a lot of homework. to read We are going to read that book.

Wiskunde en taal. Contents First Last Prev Next

De combinatie van verrijkingen, machine learning en crowd sourcing

Natuurlijke Taal Verwerking

20 maart Prof. Dr. Katrien Verleye

Taal- en Informatietechnologie. Taal- en Informatietechnologie. Informatie en tekst. Over de cursus. Over de cursus: opbouw. Over de cursus (2)

Social Selling met LinkedIn

Systeemarchitecturen en opslag van gegevens

Bouwen op een gemeenschappelijk verleden aan een succesvolle toekomst Welling, Derk Theodoor

BIBLIOTHEEK SOCIALE WETENSCHAPPEN

Les 10 : Aanmaken van een database (deel2).

University of Groningen Educational value of digital examination

Instru teki ennätystuloksen. Taal- en informatietechnologie. ehdotus. VS woedend over veto in NAVO. Tekst vs Informatie

English is everywhere. hi morning mouse cool help desk hello computers mail school game. Lees de tekst. Omcirkel de Engelse woorden.

Web of Science : Social Sciences Citation Index, Arts & Humanities Citation Index. Conference Proceedings Citation Index Social Science & Humanities

LIMO zoekt gedrukte EN elektronische publicaties - in de catalogi van de K.U.Leuven bibliotheken en de andere bibliotheken van Libisnet -in LIRIAS =

Information Retrieval: introductie 1

Wilco te Winkel, Liesbeth Mantel Erasmus University Rotterdam,NL

International Leiden Leadership Programme

BA 3 Pol PoWe_13-14_Leiden_BA_33_Pol_Part_Dem_Ennser-Jedenastik (6443PPD13) No. of responses = 14

Bibliotheek Sociale Wetenschappen 2018

Comics FILE 4 COMICS BK 2

It s all about the money Trade Fair trade

Information Retrieval.

Dementiezorg In De Praktijk, Deel 1: Van Achterdocht Tot Zwerfgedrag (Dutch Edition) By Ronald Geelen

Puzzle. Fais ft. Afrojack Niveau 3a Song 6 Lesson A Worksheet. a Lees de omschrijvingen. Zet de Engelse woorden in de puzzel.

Handleiding EndNote Web

Choral + Spraaktechnologie: ingezet voor de ontsluiting van audiovisuele

Download:

Competencies atlas. Self service instrument to support jobsearch. Naam auteur

ECHTE MANNEN ETEN GEEN KAAS PDF

Inzendingshandleiding voor auteurs

Informatiekunde in Groningen

EndNote Web handleiding

Automatic lexico-semantic acquisition for question answering Plas, Marie Louise Elizabeth van der

Online Resource 1. Title: Implementing the flipped classroom: An exploration of study behaviour and student performance

Engels op Niveau A2 Workshops Woordkennis 1

CENTEXBEL CLIENTS WEB

SAMPLE 11 = + 11 = + + Exploring Combinations of Ten + + = = + + = + = = + = = 11. Step Up. Step Ahead

MACHINE LEREN VOOR E-DISCOVERY

ZOEKEN MEDLINE COMPLETE

! GeoNetwork INSPIRE Atom!

Aan het einde van de unit kennen de leerlingen woorden in de woordvelden: kleding uiterlijk emoties landen

Het beheren van mijn Tungsten Network Portal account NL 1 Manage my Tungsten Network Portal account EN 14

Overzicht. Question Answering en Informatie Extractie. Joost: a QA system for Dutch. Question Answering

open standaard hypertext markup language internetprotocol transmission control protocol internet relay chat office open xml

AVG / GDPR -Algemene verordening gegevensbescherming -General data Protection Regulation

In the classroom. Who is it? Worksheet

Web of Science: SCI, SSCI en AHCI

BIBLIOTHEEK SOCIALE WETENSCHAPPEN

Informatie Voor algemene vragen/opmerkingen omtrent de inhoud van deze site kunt u bellen of en met: Cargo Data Systems BV

Hoe goed kennen we elkaar?

Universiteitsbibliotheek Gent

Overzicht Code Run time-structuur De Robot Bots Het ontwerp van een Bot. De Robot. Robotspeelmiddag. Sjoerd Dost, Rick Sen.

ContentSearch. Deep dive

Interactive Grammar leert de belangrijkste regels van de Engelste spelling en grammatica aan.

Handleiding EndNote Web

ProQuest. Zoeken in ProQuest-databanken: Political Science Database, Sociology Database, Social Science Database.

Senior Florist. CC Naamsvermelding 3.0 Nederland licentie.

MKB-index april 2017

Linked Data: stap voor stap, deel 4 Table of Contents

Web of Science : Social Sciences Citation Index, Arts & Humanities Citation Index Conference Proceedings Citation Index Social Science & Humanities

Leeftijdcheck (NL) Age Check (EN)

University of Groningen. Up2U Harder, Annemiek T.; Eenshuistra, Annika

ANGSTSTOORNISSEN EN HYPOCHONDRIE: DIAGNOSTIEK EN BEHANDELING (DUTCH EDITION) FROM BOHN STAFLEU VAN LOGHUM

Tentamen Objectgeorienteerd Programmeren

PDF hosted at the Radboud Repository of the Radboud University Nijmegen

Zo kan je linken maken tussen je verschillende groepen van gegevens.

Plone user case:

Scopus Zoeken in Scopus

Handleiding EndNote Web

Auteur boek: Vera Lukassen Titel boek: Excel Beginners , Serasta Uitgegeven in eigen beheer Eerste druk: mei 2013

Tip! Let op deze (of vergelijkbare) signaalwoorden: Past Simple. Wanneer gebruik je de past simple? Voorbeeld: Hele werkwoord + ed

Plan van Aanpak. Plan van Aanpak. November Student Naam: David Fremeijer Studentnr:

possessive determiners

Opgaven Kunstmatige intelligentie 4 mei 2012

Malala Ken je Malala? Wat weet je al van haar?

ALL-CRM Gebruikershandleiding AC-DataCumulator

Wanneer je al in Limo aan het werken bent, kan je scopus intypen in de zoekbalk en Databases / E-journals aanduiden.

Positionering en idee ontwikkeling. zondag 2 december 12

Handleiding RefWorks Legacy met WNC4

Een vrouw, een kind en azijn (Dutch Edition)

Zoeken naar medische literatuur Marianne van der Heijden Bureau Andromeda 19 januari 2006

Inhoud van deze handleiding

LitLab Leesclub. De goede zoon van Rob van Essen. Leesclub 26: Robots. Spelregels

Een Rugzak Vol Condooms: Stories Van Een Bimbo In De Bush (Dutch Edition) By Meike Schulte

2010 Integrated reporting

Handleiding Facultaire website Expression Engine

Artificial Intelligence in uw dagelijkse praktijk. Hilversum, 22 September 2016

Hardware Specialisatie. Module 1: Zoeken op het internet

Observatieformulier Leerlijn Engelse taal (TPO) Groep 3 & 4

Netwerk functionaliteit OTYS Recruiting Technology. Versie 2.0

Bibliotheek Sociale Wetenschappen Introductie tot het zoeken Antropologie

Transcriptie:

Question Answering College Natuurlijke Taalinterfaces Januari 2002

1 Information Retrieval, Web Search Zoek relevante documenten over een bepaald onderwerp. Vraag: keywords (en boolese connectieven), Bin Laden AND Nederland AND NOT Haselhoef Zoeken in (indexen van) Documenten, Antwoord: lijst van relevante documenten.

2 Information Retrieval, Web Search Robuust (Gigabytes aan documenten, 1000-en queries), Technieken goed onderzocht, Nadeel: Niet direct antwoord op een vraag, Documenten bevatten relevante en irrelevante informatie.

3 Information Extraction Extraheer relevante informatie uit ongestructureerde tekst, Vul hiermee een database. Vraag: database query, Antwoord: matching entries uit de database. Nadeel: Systeem bepaalt wat relevant is.

4 Een vacature-site Haalt vacatures van het web, uit de krant, Ongestructureerde informatie, Wordt doorzocht op relevante velden, b.v. functie, opleiding, bedrijf, plaats, salaris,... Informatie wordt opgeslagen in database.

5 citeseer.nj.nec.com Haalt papers van het web (ps, pdf), Wordt doorzocht op auteur, titel, abstract, verwijzingen,.. Database, met bovendien: Active bibliography, Similar documents, Users who viewed this document also viewed, Citatie-index,

6 Question Answering (2 voor 12) Who is the author of the book The Iron Lady? What was the monetary value of the Nobel Peace Prize in 1989? What does the Peugeot factory manufacture? How much did Mercury spend on advertizing in 1993? What is the name of the managing director of Apricot Computer? Why did David Koresh ask the FBI for a word processor?

7 Question Answering Vraag in natuurlijke taal, Zoeken in documenten, Antwoord: Zin (passage) uit een document: Peugeot, the French car manufacturer, announced a new model yesterday, the 307. Antwoord afgeleid uit het document: Cars.

8 Alfred Heineken overleden Bierbrouwer Alfred Heineken is donderdagavond in zijn woning in Noordwijk in alle rust overleden. Dat hebben de Raad van Beheer van Heineken Holding N.V. en de Raad van Bestuur van Heineken N.V. bekendgemaakt. Heineken werd 78 jaar. De op 4 november 1923 in Amsterdam geboren biermagnaat zal in naaste familiekring worden begraven. Heineken kampte sinds april vorig jaar na een hersenbloeding met een steeds zwakkere gezondheid. Zijn vrouw Lucille en dochter Charlene de Carvalho waren aanwezig bij de laatste uren van Alfred Heineken.

9 Alfred Heineken overleden Wanneer is Alfred Heineken overleden? Hoe oud werd Heineken? Wanneer werd Heineken geboren? Hoe heet de vrouw van Heineken? Hoeveel kinderen had Heineken?

10 TREC Text Retrieval Conference Waarom een competitie? Verzin een duidelijke opdracht, Meet precies de resultaten, Vergelijk technieken (wat werkt?), Meet vooruitgang, Wat is mogelijk met huidige technologie?

11 Motivatie TREC QA competitie QA nuttig voor Web-search, IR, IE, etc., QA lijkt mogelijk, ook voor Gigabytes, Weinig ervaring met evaluatie van QA.

12 Opzet TREC QA competitie Documenten: 2 CD s met krantentekst, Vragen: 200, concreet, met een duidelijk antwoord in de tekst, quiz-vragen, factoids: wie, wat, waar, wanneer, hoeveel,... Antwoord: fragment van maximaal 250 of 50 bytes uit de tekst,

13 Evaluatie van resultaten 3 Human Assessors beoordelen antwoorden, Meerderheid beslist, Systeem mag 5 antwoorden teruggeven, Score (Reciprocal Rank): 1 e antwoord correct: 1, 2 e : 0,5, 3 e : 0,33, 4 e : 0,25, 5 e : 0,2.

14 Typische aanpak analyseer (parse) de vraag, classificeer de vraag (naar persoon, tijdstip, hoeveelheid geld, etc), IR: selecteer relevante documenten, selecteer (parse) relevante zinnen (passages) uit relevante documenten. Beste score: 144 van 198 vragen beantwoord, 0,66 Mean Reciprocal Rank.

15 NIST Roadmap Wat zouden we willen over een paar jaar? Moeilijkere vragen (waarom, hoe, wat gebeurt er in Argentinië?), Informatie samenvoegen, Antwoorden die lijken op verslagen, samenvattingen, rapporten (wie was Freddy Heineken?)

16 Taalkundige kwesties Vragen analyseren (parseren) en classificeren, Sentence splitting: tekst naar zinnen, Stemming: woord naar stam,

17 Taalkundige kwesties Named Entity Recognition: plaatsen, etc. herkennen van namen, Shallow Parsing: herkennen van semantische relaties tussen woorden (oorzaak, gevolg, tijdstip,...) Anaphora resolution: Referenten van pronomina bepalen.