automatische zoekverbetering

Vergelijkbare documenten
Hoe zoeken de nieuwe zoeksystemen

Retrievaltechniek; technologieën voor het terugvinden van tekstuele informatie

Als je naar ERIC gaat kom je automatisch bij Basic Search (eenvoudig zoeken).

ZOEKEN IN SPORTDISCUS

Starten van de tool De tool wordt opgestart door een web browser te openen (bij voorkeur Google Chrome) en in de adresbalk te typen:

informatie architectuur 9 december 2010 IAM V

ZOEKEN IN BUSINESS SOURCE PREMIER

Gebruikershandleiding GO search 2.0

Basisfunctionaliteit van gestructureerde zoeksystemen. Illustratie aan de hand van het zoeksysteem van Ebsco.

Information Retrieval.

HANDLEIDING VOOR HET ZOEKEN IN FACTIVA

SEO webinar Beginnen met SEO

Artificial Intelligence in uw dagelijkse praktijk. Hilversum, 22 September 2016

Information Retrieval: introductie 1

Slimmer zoeken op internet

Zoekstrategieën voor succesvol zoeken

Lees eerst de algemene handleiding Gebruik Collectie Persdocumentatie!

online informatieonderzoek

ContentSearch. Deep dive

COAVA. Gebruikershandleiding. Gebruikershandleiding bij de COAVA web applicatie CLARIN-NL

SEO: GEVONDEN WORDEN OP HET INTERNET

Zoeken in PubMed. Bert Berenschot Medische Bibliotheek OLVG locatie Oost Amsterdam

ZOEKEN IN PROQUEST SOCIAL SCIENCES

studie waarmee we de principes van de analyse willen demonstreren. Een volledig beschrijving van de algoritmen en de resultaten zijn te vinden in

ZOEKRESULTAAT: SORTEREN EN VERFIJNEN (FILTERS)

ZOEKEN IN PROQUEST BUSINESS COLLECTION

informatie architectuur lesweek 4 IAM V

Handleiding SEO controle & Publiceren blog-artikelen Wageningen UR blog. Oktober 2015

Free text of gecontroleerd vocabulaire: een dilemma

3. Zoeken naar informatie

LIMO zoekt gedrukte EN elektronische publicaties - in de catalogi van de K.U.Leuven bibliotheken en de andere bibliotheken van Libisnet -in LIRIAS =

Handleiding SEO controle & Publiceren blog-artikelen Wageningen UR blog. Oktober 2015

Newsdesk Handleiding. Inhoudsopgave. Handleiding Newsdesk

Ga naar en type de woorden zelf bonbons maken in het zoekveld.

Embase. Het Automatic Term Mapping systeem van Embase helpt Subject Headings te vinden. In paragraaf 2 wordt uitgelegd hoe dit werkt.

PiCarta, Online Contents, NCC (Nederlandse Centrale Catalogus) Je kunt alle PiCarta subbestanden tegelijk doorzoeken, maar ook afzonderlijk.

HOE TREKT U ONLINE MEER KLANTEN AAN? UNIZO Retail

Inhoud van deze handleiding

zoektechnieken en -strategieën

Smartsite ixperion Faceted Search

Zoektechnieken. Eenvoudig of geavanceerd zoeken

ZOEKEN MEDLINE COMPLETE

Internet Marketing Termen

Korte Handleiding CINAHL

4. Zoeken naar informatie

Hardware Specialisatie. Module 1: Zoeken op het internet

Online marketing. De weg naar online succes. Presentatie door: Eelke Kuipers

Ranking database queries. Ranking in IR. Classic ranking in IR. Ranking in IR. Ranking in IR: score. Advanced Databases

ABC Analytics Handleiding

Aan de slag met: eenvoudig zoeken en filteren van zoekresultaten

Jouw bedrijf in 3 stappen bovenin Google Whitepaper online vindbaarheid versie augustus 2012

HANDLEIDING CONTENT MANAGEMENT SYSTEEM

Workshop. SEO & SEA in a nutshell

C o n t e n t M a n a g e m e n t S y s t e e m. G e b r u i k s a a n w i j z i n g

Lexicografie en lexicologie

SEARCH. Gevonden worden met uw bedrijf

Zoekscherm: Nieuws. Nexis Quickcard. Zoeken in nieuws

Geavanceerd zoeken. Handleiding Versie

Op zoek naar wetenschappelijke literatuur?

Welkom. Internet Marketing. door: Daisy Leenders

Afsluitende les. Leerlingenhandleiding. Proteomics voor de massa

Van PVE via RFI langs

3. Zoeken naar informatie Surfen op internet met de app Internet Explorer Werken met

ADWORDSCADABRA TOVEREN MET ONLINE ADVERTISING

Ontdek een betere manier om uw catalogus te doorzoeken

Bibliotheek Queteletfonds Vooruitgangstraat Brussel Tel: Fax:

2. Wikiwijs zoeken van een arrangement

informatie architectuur samenvatting hoorcolleges V1 blok 1 september / oktober 2010

Zoeken op het Web Inleiding

Instructies annotatie experiment

Search Engine Optimalization (SEO)

Welkom. Internet Marketing zonder grenzen. door: Daisy Leenders

Informatievaardigheden Introductie EndNote

informatie architectuur lesweek 4 IAM V

Gids voor snelle start met e-learning

Hier worden de termen weergegeven die u in uw zoekvraag hebt opgenomen.

SEO IS SIMPEL SEARCH ENGINE OPTIMIZATION E-BOOK

Handleiding RefWorks 2016

ZOEKEN IN EUROMONITOR PASSPORT

Online marketing. De weg naar online succes. Presentatie door: Eelke Kuipers

Bitrix Site Manager gebruikershandleiding BureauZuid

Handleiding. CROW Kennisbank. Contentmanagement

Transcriptie:

automatische zoekverbetering taaltechnologische technieken Eric Sieverts VOGIN HvA / december 2012

(taal)technologische methoden best-match zoeken met relevantie-ordening truncatie, wordstemming, fuzzy search semantische kennis toevoegen suggereren van betere zoektermen suggereren van aanvullende zoektermen zoekresultaat clusteren in "domeinen/contexten terugkoppeling van zoekersoordeel

relevance ranking factoren 1. meer van de gevraagde termen in een document 2. gevraagde termen op belangrijke plek in document (titel, koppen, eerste paar regels,.) 3. gevraagde termen komen in document herhaald voor 4. gevraagde termen staan in document dicht bij elkaar 5. termen in document staan in zelfde volgorde als in vraag 6. zeldzame termen krijgen zwaarder gewicht dan algemene 7. hoeveel hyperlinks naar document verwijzen 8. hoe vaak een document / site wordt "bezocht" 9. of site/pagina/bericht tot je sociale netwerk hoort 10. werkt goed op het web, maar ook op een intranet?

relevance ranking factoren 1. meer termen 2. termen in titel/kop/begin 3. termen herhaald 4. termen dicht bij elkaar 5. termen in volgorde 6. zeldzame termen zwaarder 7. hyperlinks naar document 8. bezoek aan document 9. in sociale netwerk meer concepten ge-and hoger term-gewicht hoger term-gewicht juiste verband juiste verband belang specifieke term (kwaliteit) [alleen als er links zijn] (kwaliteit) (context) [alleen op open web] gericht op hogere relevantie voor "eerste tien", dus op betere precisie

truncatie / word-stemming / fuzzy trunceren stemming fuzzy computer computeronderwijs computer computing, computation, computed, computers communism community, communication?? sieverts sievert?? duivendak duijvendak, duyvendak serajevo sarajevo, serajewo medvedev medvediev, medwedew, kok kop, kak,...?? gericht op betere recall, maar pas op voor ongewenste effecten

semantische kennis in semantisch netwerk worden betekenissen van woorden vastgelegd (hele woordenboek) & worden betekenisrelaties gelegd tussen inhoudelijk verwante woorden (in één of meer talen) door omgeving van woord in het netwerk kan betekenis worden onderscheiden (in document en in query) gericht op betere precisie omgeving van woord in het netwerk kan termen leveren om query mee uit te breiden (woorden binnen bepaalde "semantische afstand" van zoekwoord) gericht op betere recall

visualisatie van wordnet

termen verbeteren computer suggereert iets afwijkende term door fuzzy-search in woordenboek door fuzzy search in eigen index >> term die (veel) meer oplevert door generieke kennis van vaak gemaakte tikfouten bijv.: Google (did you mean ) gericht op betere recall

aanvullende termen extraheren computer haalt karakteristieke (andere) woorden/begrippen uit eerste N documenten van zoekresultaat (statistiek - tf idf) gebruiker kiest daaruit termen om zoekactie in te perken (soms ook termen uit te sluiten, of juist resultaat met OR uit te breiden) bijv.: Quintura (frontend voor Yahoo) Scirus database van Elsevier Aquabrowser (o.a. bij bibliotheek.nl) gericht op betere precisie (of bij OR betere recall)

AND

zelf in OR te veranderen!

ook faceted zoeken, waarbij zoekresultaat al wordt opgedeeld aan de hand van daarin aanwezige "geformaliseerde metadata" wolk van termen in Aquabrowser: die termen kunnen uit statistische analyse, woordenlijst, thesaurus, semantisch netwerk o.i.d. komen

ook faceted zoeken, waarbij zoekresultaat wordt opgedeeld aan de hand van daarin aanwezige "geformaliseerde metadata"

automatisch clusteren/classificeren op grond van kennisregels (en bestaande taxonomie ) in feite toepassing automatische classificatie, waarbij klassen als verdelingscriterium dienen op grond van statistiek of patronen Clusty, Polymeta,. Autonomy gericht op betere precisie

terugkoppeling gebruiker klikt bij relevante hit op more like this computer zoekt op grond van daarin aanwezige termen of patronen naar daarop lijkende documenten bijv.: Scirus, Google SimilarPages (Firefox Add-on) Autonomy gebruiker markeert relevante hits zoektermen of patronen die in die documenten voorkomen krijgen hoger gewicht bij toekomstige zoekacties krijgen documenten met die termen of patronen een hogere berekende relevantie bijv.: Autonomy en ook personal Google? gericht op betere recall

max havelaar keurmerk product max havelaar - het boek

gelijkenis- patronen bij Google site 1 site 2 site 3 site 4 site 5 site 6 site 7 site 8 site 9 hyperlinks similar site goede site similar site similar site similar site similar site similar site similar site