Smartsite Faceted Search



Vergelijkbare documenten
Smartsite ixperion Faceted Search

Gebruikershandleiding GO search 2.0

Mach3Framework 5.0 / Website

Modulehandleiding VivianCMS. Zoeken

Seneca B.V. Elektronicaweg XG Delft Nederland T +31(0) F +31(0) E info@smartsite.nl I

Mach3Framework 5.0 / Website

SUBSITE BEHEREN. 1. Verticale navigatie maken

Lees eerst de algemene handleiding Gebruik Collectie Persdocumentatie!

Smartsite Management Information

SEO handleiding Footsteps. Inleiding. Opbouw

HANDLEIDING BEHEER WEBSITE. Vrouwen van Nu

Handleiding. HetSchoolvoorbeeld.nl. HetSchoolvoorbeeld 2.1. Websites voor het onderwijs. Websites Social media Mediawijsheid Grafisch ontwerp

De meest complete informatievoorziening voor de publieke sector

informatie architectuur 9 december 2010 IAM V

Zicht - Content Management Systeem een algemene beschrijving

Handleiding LexisNexis NewsPortal

SELECTEER EEN PAGINA TEMPLATE EN HOOFD VOOR DE PAGINA: Selecteer, in de PAGINA ATTRIBUTEN module rechts naast

Eenvoud, kracht en snelheid

Handleiding. HetSchoolvoorbeeld.nl. Versie juni Websites voor het onderwijs. Meest recente uitgave: www. hetschoolvoorbeeld.

MA!N Rapportages en Analyses

Bitrix Site Manager gebruikershandleiding BureauZuid

Schoolwebsite.nu. Snel aan de slag met uw website. Versie 4.0

WebHare Professional en Enterprise

Handleiding. CROW Kennisbank. Contentmangement

De functionaliteit Uitgebreid Zoeken is te vinden onder het volgende icoon:

Handleiding SEO controle & Publiceren blog-artikelen Wageningen UR blog. Oktober 2015

ZOEKMACHINE-OPTIMALISATIE,

CMS HANDLEIDING

Catalogger 9.0 features

Handleiding. CROW Kennisbank. Contentmanagement

Inhoud van de website invoeren met de ContentPublisher

HOE WORD JE HET EERSTE ZOEKRESULTAAT?

SEO: GEVONDEN WORDEN OP HET INTERNET

Uw online ambities realiseren met Smartsite ixperion content management


Jouw bedrijf in 3 stappen bovenin Google Whitepaper online vindbaarheid versie augustus 2012

Serienummers worden met hun ID opgeslagen

Handleiding Website Laatste update: april 2014

Gebruikersvriendelijke beheer van bestanden in SharePoint

Les 13. Voorbereiding

Handleiding voor ondernemers

SEO IS SIMPEL SEARCH ENGINE OPTIMIZATION E-BOOK

SAN v3. Update document uitgebracht door OCEN

WEBSITE SCAN Vrijblijvend advies

Internet Marketing Termen

Technische nota AbiFire Rapporten maken via ODBC

Hoe bouw ik een goede website?

Globale kennismaking

Handleiding Wordpress CMS

Gebruikershandleiding Psychorom. Bohn Stafleu van Loghum

OpenIMS 4.2 Portaal Server

Websites aanpassen. Voor iedereen.

Handleiding SEO controle & Publiceren blog-artikelen Wageningen UR blog. Oktober 2015

MEDIABIBLIOTHEEK HANDLEIDING. OTYS Recruiting Technology

VERZENDLIJSTEN HANDLEIDING. OTYS Recruiting Technology

HANDLEIDING Content Management Systeem de Fertilizer 4

ZOEKEN MEDLINE COMPLETE

De Outlook en SharePoint integratie

Handleiding Update Trefwoordenlijst v3.0 (Geavanceerde trefwoordenlijst)

OpenIMS 4.2. Content Management Server. Gebruikers handleiding

WORDPRESS TRAINING: 1. AANMELDEN

SEO whitepaper. 1. Inleiding Wat is SEO? Onderdelen SEO Praktische SEO tips Hulp nodig? 10

Handleiding Online Kennisbank CROW. Contentmanagement

A SIMsubsites algemeen A-1. B Beheren van subsites B-1

Websites & Zoekmachines

IQ LEADS Adres: Curieweg 8E Postcode: 2408 BZ Plaats: ALPHEN AAN DEN RIJN Telefoon: (0172)

Gebruikersvriendelijke beheer van bestanden in SharePoint

Inleiding. Schema Achterhoekagenda

REDACTEUREN HANDLEIDING

HetSchoolvoorbeeld.nl

Handleiding. citynavigator database Friesland.nl

BIBLIOTHEEK SOCIALE WETENSCHAPPEN. Handleidingen

Hardware Specialisatie. Module 1: Zoeken op het internet

Rapporten. Labels en Rapporten in Atlantis 1. Atlantis heeft twee manieren om output te genereren: 1. labels 2. rapporten (reports)

Handleiding CMS. Auteur: J. Bijl Coldfusion Consultant

Algemene handleiding beheermodule: WORDPRESS. digital4u.nl effectief op internet

Bijlage Inlezen nieuwe tarieven per verzekeraar

HOE TREKT U ONLINE MEER KLANTEN AAN? UNIZO Retail

PvdA websites Quick Start voor het werken met het Hippo CMS

AFO 113 Authoritybeheer

Handleiding Facultaire website Expression Engine

Transcriptie:

Seneca B.V. Elektronicaweg 31 2628 XG Delft Nederland T +31(0)15-251 37 00 F +31(0)15-251 37 01 E info@seneca.nl I www.seneca.nl Whitepaper Smartsite Faceted Search 2011 Seneca B.V. Alle rechten voorbehouden

Inhoudsopgave Management summary 3 1 Inleiding 4 2 Te veel of te weinig 5 3 Hoe doorzoekt een bezoeker mijn website? 7 4 Faceted Search 8 5 Altijd actuele zoekresultaten 9 6 De juiste zoektermen 10 7 De gebruikerservaring 11 8 Geavanceerde zoekmogelijkheden 13 8.1. Booleaans zoeken 13 8.2. Zoeken met Wildcards 13 8.3. Zoeken met literals 14 8.4. Omgaan met bijzondere tekens 14 9 Zoekresultaten weergeven 15 10 Hoe werkt Smartsite ixperion Faceted Search? 16 11 Doorzoeken van verschillende contentsoorten 17 12 Zoeken in documenten 18 13 Doorzoeken van afbeeldingen 19 14 Zoeken in andere bronnen 20 14.1. Database tabellen 20 14.2. User Generated Content 20 15 Zoeken en mobiele kanalen 21 16 Zoeken in een beveiligde omgeving 22 17 Contextgevoelig zoeken 23 18 Invloed uitoefenen op de ranking van zoekresultaten 24 18.1. Contenttype en bronveld 24 18.2. Leeftijd 25 18.3. SEOPriority 25 18.4. Beïnvloeding door gebruik 25 18.5. Configuratie van afzonderlijke gewichten 25 19 Management information over zoeken 26 20 Search Enhancements 27 20.1. Sneller naar een resultaat 27 20.2. Naar een beter resultaat 27 21 Faceted Search in een kennisomgeving 31 21.1. Zoekopdrachten opslaan 31 21.2. Zoekopdrachten regelmatig laten uitvoeren 31 21.3. Faceted Search als primaire navigatie hanteren 31 22 Zoeken in meertalige omgevingen 32 23 Zoekfunctie voor redacteuren en developers 33 24 Technologie 34 25 Zoekopdrachten configureren 35 26 Ondersteunde standaarden 36 26.1. OpenSearch 36 26.2. Smartlets 36 26.3. Webrichtlijnen 36 26.4. Smartsite Personalization Framework 37 27 Feature matrix 38 28 Installatie en beheer 39 29 Een literair voorbeeld 40 2 van 50 2011 Seneca B.V. Alle rechten voorbehouden

Management summary Smartsite ixperion Faceted Search biedt zoekmogelijkheden in een Smartsite ixperion omgeving, die ongekend zijn met betrekking tot zowel rijkdom van opties als met betrekking tot kracht en prestaties. Met Smartsite Ixperion Faceted Search krijgen bezoekers van websites de mogelijkheid om snel naar voor hen relevante informatie te navigeren. Zo kan zoeken een belangrijk navigatiemiddel vormen in een site. Smartsite ixperion Faceted Search is zeer flexibel in zijn configuratie en kan uitstekend worden ingepast in verschillende toepassingen. De zoekmachine kan zich met meerdere gezichten en verschillende functies in verschillende delen van de website presenteren. De uitrol van Smartsite ixperion Faceted Search in nieuwe en bestaande door Smartsite ixperion aangedreven websites is eenvoudig te realiseren. De inpassing in interactie en design is dankzij gebruik van het Smartsite Client Framework en Smartlet technologie zeer transparant. In de vergelijking met andere zoekoplossingen, zoals Google Search Appliances, onderscheidt Smartsite ixperion Faceted Search zich door onder meer onderstaande kenmerken: Altijd actuele zoekresultaten Beschikbaar in redactieomgeving Krachtige, vrij inrichtbare faceted search Verschillende (bestuurbare) search enhancements Respecteren van gebruikersrechten Alle user interface onderdelen als Smartlet beschikbaar Zoeken binnen resultaten Zoekopdrachten opslaan voor later hergebruik. Ik hoop dat dit document een aangename kennismaking met Smartsite ixperion Faceted Search zal zijn en zal uitnodigen tot inzet in eenvoudige en complexe websites. Dit document is niet bedoeld om van voor tot achter door te lezen. Hopelijk geeft het u een indruk van de mogelijkheden bij het doornemen in vogelvlucht. Vanzelfsprekend zijn we graag bereid in meer detail een toelichting te bieden op Smartsite ixperion en de bijbehorende modules. Namens het Research & Development team, Delft, april 2011 Johan Blok Directeur Strategie, Seneca BV 3 van 50 2011 Seneca B.V. Alle rechten voorbehouden

1 Inleiding Zoeken is de nieuwe manier van navigeren is een veelgehoorde uitdrukking. Ook als dit misschien een overstatement is, mag duidelijk zijn dat in moderne websites, waarin vele tienduizenden of honderdduizenden eenheden informatie voorhanden kunnen zijn, zoeken steeds belangrijker is geworden. Met een goede zoekfunctie kan een bezoeker met slechts enkele handelingen uit deze veelheid van informatie het voor hem belangrijke destilleren. Zoekmachines, zoals Google, Yahoo! en Bing, worden zowel door consumenten als door professionals vaak gebruikt om de juiste website te vinden. Als men dan eenmaal op een landing page of een deeplink pagina van de betreffende website is aangekomen, navigeert men van daaruit door met de voorhanden navigatiehulpmiddelen (zoals menu s, trefwoorden, index, gerelateerde pagina s et cetera). Als dat niet snel tot de verwachte resultaten leidt, haakt de bezoeker af en vertrekt deze, al dan niet via Google, naar andere, mogelijk concurrerende websites. Zoekmachineoptimalisatie zorgt ervoor dat Google en andere zoekmachines zo goed mogelijk worden gevoed, zodat zoveel mogelijk relevante bezoekers via deze zoekmachines op de betreffende website belanden 1. Vanaf dat moment is echter de aantrekkelijkheid van de website, de relevantie van de geboden informatie en de kracht van de navigatie van de website bepalend voor het vasthouden van de bezoeker. De zoekfunctie binnen de website is cruciaal in het vasthouden van de bezoeker en het toeleiden naar de voor hem relevante informatie. Omdat Smartsite ixperion Faceted Search kennis heeft van achterliggende (content management) informatie van de website, is het in staat om meer dan externe zoekmachines diepgang en samenhang van de zoekresultaten en mogelijkheden tot inzoomen op resultaten te bieden. Smartsite ixperion Faceted Search kan worden gezien als een low cost, high power, high performance zoekmachine die zeer open en flexibel inzetbaar is. Dit document biedt een overzicht van de meest relevante functies van Smartsite ixperion Faceted Search. Sommige functies zijn alleen binnen een bepaalde context beschikbaar. Voor een overzicht verwijzen we naar de feature matrix (zie hoofdstuk 27). 1 Hiervoor is binnen Smartsite ixperion de Search Engine Optimization Toolkit beschikbaar. 4 van 50 2011 Seneca B.V. Alle rechten voorbehouden

2 Te veel of te weinig De praktijk van het zoeken in veel websites is veelal dat een eerste zoekopdracht te veel of te weinig resultaten oplevert om dichter bij relevante informatie te komen. Een eenvoudig voorbeeld illustreert dit. Een gemeentelijke website maakt voor het zoeken in haar website gebruik van een Google Search Appliance. Als op de homepage de zoekterm vergunning wordt opgegeven resulteert dit op een gegeven dag in circa 2.140 zoekresultaten, waarvan de eerste tien worden afgebeeld. Gebruikers zullen in het algemeen niet graag alle 2.140 zoekresultaten doorbladeren om de gewenste informatie te vinden. Daarom wordt een verdiepingskans geboden: Figuur 1. De eerste van 2.140 zoekresultaten worden direct afgebeeld. Rudimentaire verfijning is mogelijk. De verfijningsfunctie is echter niet meer dan de mogelijkheid om op min of meer vriendelijke wijze een aantal zogenaamde booleaanse 2 zoekopdrachten te formuleren. Zo kan een tweede zoekterm, bijvoorbeeld dakkapel worden toegevoegd. Een gebruiker, die niet bekend is met deze wijze van werken, loopt hier echter vast. Er zijn geen mogelijkheden voor een vervolgactie of voor een verfijning van de zoekresultaten op basis van intuïtie of aangereikte hulpmiddelen. Dezelfde zoekopdracht naar de woorden vergunning en dakkapel in Google (www.google.nl) levert vanzelfsprekend een veel groter aantal resultaten op, want nu worden alle bij Google bekende websites doorzocht: 2 Een booleaanse zoekopdracht combineert verschillende zoektermen met booleaanse operatoren, zoals AND, OR en NOT. De zoekopdracht vergunning AND dakkapel vertelt de zoekmachine alleen resultaten te tonen die beide woorden bevatten. vergunning NOT evenement toont alleen zoekresultaten die wel het woord vergunning maar niet het woord evenement bevatten. (vergunning OR dakkapel) NOT evenement is een weer verder gaande constructie. De zoekmachine geeft nu alle resultaten die het woord vergunning en/of het woord dakkapel bevatten; maar alle resultaten die ook de term evenement bevatten worden uit de lijst uitgesloten. Het standaard gedrag van Google bij invoer van meerdere zoektermen is overigens om eerst alle zoekresultaten aan te bieden die alle zoektermen bevatten, daarna zoekresultaten die zoveel mogelijk van de zoektermen bevatten; met andere woorden: eerst een AND operator, en daarna worden de resultaten aangevuld met resultaten uit een zoekopdracht met OR operator (met vanzelfsprekend ontdubbeling van resultaten). 5 van 50 2011 Seneca B.V. Alle rechten voorbehouden

Figuur 2. Zoekresultaten in Google. Na de gesponsorde links worden resultaten weergegeven uit alle door Google geanalyseerde websites; de volgorde van die resultaten (de ranking ) wordt bepaald door grotendeels geheime procedés, waarvan veelal alleen de algemene principes bekend zijn. In de linker kolom kan via meer opties / minder opties een beperkte verfijning worden gemaakt in de 48.500 resultaten die nu worden gevonden. Door op afgelopen week te klikken worden alleen resultaten uit deze periode afgebeeld (in dit voorbeeld nog 377 resultaten). Een dergelijke verfijning reduceert op significante wijze het aantal zoekresultaten en verhoogt de kans dat de gezochte informatie wordt gevonden. Een dergelijke manier van verfijnen kan een rudimentaire vorm van faceted search of gefaceteerd zoeken genoemd worden; in dit voorbeeld is dan als facet de meest recente wijzigingsdatum gehanteerd. Net zoals ieder facet van een diamant op een andere manier iets laat zien van de diamant, toont een zoekfacet de resultaten van de zoekopdracht in een bepaald licht. 6 van 50 2011 Seneca B.V. Alle rechten voorbehouden

3 Hoe doorzoekt een bezoeker mijn website? Hoe doorzoekt een bezoeker van mijn website? Hoe zou een bezoeker willen zoeken? Als we dat kunnen vaststellen, kunnen we aansluiten bij de wensen van de bezoeker en deze als het ware aan de hand meenemen. Bij het implementeren van een zoekoplossing binnen uw website is het dan ook van belang dat u allereerst een beeld krijgt van het huidige gedrag van bezoekers op uw website. En daarbij moet u mogelijk een onderscheid maken tussen verschillende soorten bezoekers: consumenten, specialisten, burgers, bedrijven, jongeren, ouderen, buurtbewoners et cetera. Voor onderzoek naar het navigatie- en naar het zoekgedrag op uw website zijn verschillende analysetools beschikbaar, waaronder Smartsite Management Information. Hiermee stelt u vast welke pagina s populair zijn, meet u hoeveel bezoekers naar uw website worden geleid via Google of Bing, en hoe zij binnen uw website navigeren. Een belangrijke rapportage die Smartsite Management Information kan presenteren, is die van de gehanteerde zoektermen. Op welke woorden is gezocht binnen uw site? Welke zoekopdrachten leidden tot daadwerkelijke resultaten? Welke zoekopdrachten retourneerden geen enkel resultaat? Smartsite ixperion Faceted Search biedt een groot aantal hulpmiddelen om bezoekers van de website naar de door hun gewenste informatie te geleiden. De volgende hoofdstukken richten zich op afzonderlijke aspecten van Smartsite ixperion Faceted Search. 7 van 50 2011 Seneca B.V. Alle rechten voorbehouden

4 Faceted Search De zeer elementaire wijze van gefaceteerd zoeken, zoals onder meer door Google geboden op basis van publicatiedatum, wordt beperkt door het feit dat Google webpagina s van zeer vele website indexeert middels een geautomatiseerd websitebezoek 3. Meer informatie dan in de webpagina is opgenomen, is voor Google niet beschikbaar en het aantal bruikbare facetten is dus beperkt. Daar komt nog bij dat Google sommige informatie, die wel beschikbaar is, niet gebruikt (denk aan trefwoorden et cetera), omdat deze vaak worden misbruikt door commerciële websites in de strijd om de hoogste ranking bij bepaalde zoekopdrachten. Voor een zoekoplossing binnen uw eigen Smartsite ixperion website is echter een schatkamer aan aanvullende informatie uit het content management systeem beschikbaar. Smartsite Faceted Search maakt daadwerkelijk gebruik van deze schatkamer. Wat ziet Google? Titel van de pagina Korte beschrijving van de pagina Laatst gewijzigd Taal van de pagina Tekst van de pagina Welke informatie is nog meer beschikbaar Titel van de pagina Korte beschrijving van de pagina Laatst gewijzigd Taal van de pagina Tekst van de pagina Naam van de auteur Redactioneel toegevoegde trefwoorden Het type informatie (contenttype) Begindatum van publicatie (StartDate) Einddatum van publicatie (EndDate) Doelgroepinformatie Relaties met andere content items Voorgaande versies van content items... (en alle andere informatie in het CMS...) Figuur 3. Meer informatie per content item beschikbaar in het CMS (niet uitputtend) Omdat veel meer aanvullende informatie beschikbaar is, kunnen binnen Smartsite ixperion Faceted Search relevante extra facetten worden geconstrueerd, bijvoorbeeld doelgroepen, trefwoorden, auteurs, informatietypen. Ieder facet toont de zoekresultaten vanuit een andere invalshoek en kan dienen als filter. Smartsite ixperion Faceted Search biedt vervolgens de mogelijkheid om meerdere facetten te combineren; dus alle beleidsdocumenten van auteur Jansen; of alle openbare documenten voor de doelgroep medewerkers die als een van de trefwoorden corporate identity hebben en die in de afgelopen week zijn gepubliceerd. Hoe deze facetten te definiëren, zullen we verderop zien. Eerst bekijken we nog een aantal generieke uitdagingen rond het zoeken in websites. 3 Dit is het spideren van een website, waarbij met regelmatige tussenafstanden een geautomatiseerd proces alle (gewijzigde) webpagina s door Google worden ingelezen, geanalyseerd en geïndexeerd. 8 van 50 2011 Seneca B.V. Alle rechten voorbehouden

5 Altijd actuele zoekresultaten Het belang van real-time resultaten is steeds groter geworden; waar internet zoekmachines als Google en Bing bijvoorbeeld een maal per dag een website indexeren, zodat recent toegevoegde (nieuws-)berichten, blog entries en andere informatie kunnen worden gevonden, werkt Smartsite ixperion Faceted Search (na de initiële indexering) met een altijd actuele index, zodat een nieuwsbericht, dat zojuist werd toegevoegd, of een actuele blog post ook direct via de zoekfunctie is terug te vinden 4. Het belang van de actualiteit van zoekresultaten kan niet worden onderschat. Een nieuwsbericht over een calamiteit in de regio op een gemeentelijke website moet natuurlijk direct worden gevonden. Zojuist toegevoegde informatie in een kennisbank, die wordt ingezet in een call center, kan direct bijdragen aan de oplossingsscore van call agents. In een commerciële omgeving neemt de conversiekans toe door de actualiteit. Deze actualiteit van de zoekresultaten is overigens niet alleen voor de bezoeker van de website van belang, maar ook voor het redactionele proces is cruciaal dat recente mutaties direct worden gevonden. 4 Voor externe documenten, die door middel van een zg. FileLink worden ontsloten, geldt een korte wachttijd, e.e.a. afhankelijk van het gehanteerde interval bij synchronisatie. 9 van 50 2011 Seneca B.V. Alle rechten voorbehouden

6 De juiste zoektermen Succesvol zoeken is relatief eenvoudig als degene die de zoekopdracht opgeeft de precieze zoekterm(en) kent. Dat is in de praktijk veelal niet het geval. Daarom is het belangrijk dat zoekmachines ook in ieder geval een zekere mate van interpretatie van de zoekterm(en) toepassen. Smartsite ixperion Faceted Search biedt vanzelfsprekend deze functionaliteit. Een bekend probleem is de typefout in de zoekopdracht. Tenzij in het redactionele proces dezelfde typefout is gemaakt, is de kans is groot dat er geen zoekresultaten worden gevonden. De Did you mean... ( Bedoelde u misschien... ) mogelijkheid wordt aangeboden op basis van gelijkende, eerder door andere bezoekers opgegeven zoekopdrachten, die ook daadwerkelijk resultaten opleverden. Zo wordt de zoekomgeving een zelflerend systeem. Het tonen van automatisch aangevulde zoekopdrachten ( Autocompletion ) op basis van eerdere zoekopdrachten van derden voorkomt dat typefouten gemaakt worden en helpt zo ook tot een correcte zoekopdracht te komen. Daarnaast wordt ook nog op andere wijzen de zoekopdracht verrijkt; zie daarvoor hoofdstuk 20. 10 van 50 2011 Seneca B.V. Alle rechten voorbehouden

7 De gebruikerservaring Smartsite ixperion Faceted Search maakt gebruik van Smartlet technologie, die geënt is op de progressive enhancement aanpak. Dit wil zeggen dat in een browser met beperkte mogelijkheden de werking geborgd is, en dat bij gebruik van een browser met meer mogelijkheden (Javascript) het gebruik fraaier en effectiever is. Zo zorgt deze werkwijze ervoor dat bij het bladeren door zoekresultaten geen volledige verversing van de webpagina is vereist; datzelfde geldt als via de facetten een filtering wordt toegepast op de resultaten. Dit alles leidt ertoe dat het zoeken en het navigeren door de zoekresultaten een vloeiender verloop heeft en in het algemeen ook sneller werkt. Figuur 4. Een eerste zoekopdracht in een literatuursite aangedreven door Smartsite ixperion. Rechts een aantal facetten, waaronder die van de auteur. Facetten zorgen ervoor dat snel ingezoomd kan worden op de resultaten. Het hierboven afgebeelde facet van de auteur nodigt uit tot klikken, bij voorbeeld op HG Wells : 11 van 50 2011 Seneca B.V. Alle rechten voorbehouden

Figuur 5. Na selectie van de auteur. Na selectie van de auteur HG Wells worden alleen de zoekresultaten getoond waaraan zijn naam is verbonden. Zo is HG Wells een filter geworden, dat in de lijst met toegepaste filters wordt getoond. Vervolgens kan bijvoorbeeld worden ingezoomd door een keuze in een ander facet te maken. Zodoende wordt binnen een aantal klikken het aantal relevante zoekresultaten tot een overzichtelijk aantal gereduceerd. Daarmee is de kans groot dat het gewenste antwoord op de zoekopdracht is gevonden. Interessant is dat filters ook weer kunnen worden uitgezet. Als mocht blijken, dat met de keuze in een facet als het ware te diep is ingezoomd, kan die stap eenvoudig ongedaan worden gemaakt door het filter weer te verwijderen. 12 van 50 2011 Seneca B.V. Alle rechten voorbehouden

8 Geavanceerde zoekmogelijkheden Complexere zoekopdrachten kunnen worden samengesteld met behulp van onderstaande opties. Het is daarvoor niet nodig dat een afzonderlijke optie geavanceerd zoeken wordt aangeboden; deze opties werken in de standaard zoekbox. 8.1. Booleaans zoeken Booleaans zoeken is een manier om de zoekmachine eenduidige instructies te geven, vooral als meerdere zoektermen tegelijkertijd relevant zijn. Expliciet booleaans zoeken is op het eerste oog complex. Daarom een korte toelichting. Een booleaanse zoekopdracht combineert verschillende zoektermen met booleaanse operatoren, zoals AND, OR en NOT. De zoekopdracht vergunning AND dakkapel vertelt de zoekmachine alleen resultaten te tonen die beide woorden bevatten. vergunning NOT evenement toont alleen zoekresultaten die wel het woord vergunning maar niet het woord evenement bevatten. vergunning OR dakkapel NOT evenement is een weer verder gaande constructie. De zoekmachine geeft nu alle resultaten die het woord vergunning en/of het woord dakkapel bevatten; maar alle resultaten die ook de term evenement bevatten worden uit de lijst uitgesloten 5. Voor AND kan een + worden gebruikt, voor NOT een -. Het standaard gedrag van een zoekmachine, zoals Google, is dat bij afwezigheid van booleaanse operatoren verondersteld wordt dat de voorkeur van degene die de zoekopdracht opgeeft is om resultaten te vinden die alle zoektermen bevatten. Ook Smartsite ixperion Faceted Search werkt volgens deze aanname. Overigens werkt een booleaanse zoekopdracht op het totaal van een contentitem; m.a.w. als een van de opgegeven zoektermen voorkomt in de titel en een andere in het tekstveld, wordt voldaan aan de zoekcriteria. Figuur 6. Zoeken op city AND ship levert 20 resultaten. Bovenstaand voorbeeld geeft aan dat bij het zoeken met de AND operator 20 resultaten gevonden worden. Daarentegen is het aantal resultaten bij gebruik van de OR operator 182: Figuur 7. Zoeken met OR levert 182 resultaten. 5 Smartsite ixperion Faceted Search interpreteert in de huidige release geen haakjes in een booleaanse zoekopdracht. De zoekopdracht wordt van links naar rechts geëvalueerd. 13 van 50 2011 Seneca B.V. Alle rechten voorbehouden

8.2. Zoeken met Wildcards Zoeken met wildcard symbolen (* of?) biedt de mogelijkheid breder te zoeken. Zo wordt met de zoekopdracht in onderstaande voorbeeld admin* zowel administrator, administered en administrative gevonden. Figuur 8. zoeken met een wildcard op admin*. 8.3. Zoeken met literals Om de zoekmachine opdracht te geven alleen resultaten te tonen die de precieze zoekterm of zinsnede bevat, dient de zoekterm ingesloten te worden door dubbele aanhalingstekens. 8.4. Omgaan met bijzondere tekens Diacrieten (zoals ä, ë en ü) vormen voor veel zoekmachines een bijzondere uitdaging. Smartsite ixperion Faceted Search kan volledig met diacrieten omgaan. Om het woord geëvalueerd te vinden in een content item is het echter niet nodig dat dit ook als zoekterm wordt ingevoerd (want het zou voor velen een lastige opgave zijn om een ë via het toetsenbord in te voeren); invoer van geevalueerd levert ook resultaten met geëvalueerd. 14 van 50 2011 Seneca B.V. Alle rechten voorbehouden

9 Zoekresultaten weergeven Het is voor de gebruiker van groot belang dat snel inzicht verkregen wordt in de zoekresultaten. De uitvoer kan op maat worden geconfigureerd, zodat de presentatie kan worden afgestemd op de doelgroep(en). Belangrijk in de opmaak zijn vooral de titel en het abstract (een relevante sectie uit de informatie, die de bezoeker een goede indicatie geeft waarover het betreffende bericht gaat); in het abstract worden de opgegeven zoektermen door middel van highlighting aangeduid voor snellere herkenbaarheid. Bij titel en abstract kunnen bijvoorbeeld ook auteur en publicatiedatum worden weergegeven. De titel is tevens de hyperlink naar het betreffende content item. Het contenttype kan bijvoorbeeld middels een icoon worden aangeduid, met de gebruikelijke iconen voor PDF, Word, Excel et cetera. De gangbare volgorde waarin de resultaten worden afgebeeld is die volgens de door de zoekmachine bepaalde ranking. Een andere veel gewenste volgorde is die van de publicatiedatum. Dan staat bij een zoekopdracht het meest recente item bovenaan. Er kan vanzelfsprekend bij beide sorteringmogelijkheden door de resultaten gebladerd worden 6. 6 Bladeren door de zoekresultaten levert overigens niet, zoals bij Google, een voortdurende paginaverversing op (mits Javascript actief is in de betreffende browser). Dit betekent dat de gebruikerservaring veel vloeiender verloopt en andere elementen op de pagina met zoekresultaten niet voortdurend opnieuw behoeven te worden geladen (zoals facets, banners, et cetera). 15 van 50 2011 Seneca B.V. Alle rechten voorbehouden

10 Hoe werkt Smartsite ixperion Faceted Search? Smartsite ixperion Faceted Search maakt optimaal gebruik van de onder het CMS liggende database technologie en kent daarvoor verschillende modi, bijvoorbeeld Native (ook geschikt voor Oracle 10g/11i), Microsoft SQL Server 2005, Microsoft SQL Server 2008. Voor iedere modus gelden specifieke beperkingen en mogelijkheden. Smartsite ixperion Faceted Search doorzoekt indien beschikbaar van de bronnen de full text index die door het RDBMS wordt bijgehouden. Is er geen full text index, dan wordt (bijvoorbeeld in native mode) een bevraging op een database tabel of view gedaan. Vervolgens worden filters (al dan niet in de vorm van facetten) en beveiliging toegepast om alleen de toegestane en relevante resultaten te kunnen aanbieden. De rol van het onder het CMS liggende database systeem is aanmerkelijk. Smartsite ixperion Faceted Search maakt intensief gebruik van bijvoorbeeld de mogelijkheden van Microsoft SQL Server 2008, indien dit het gebruikte RDBMS is. Figuur 9. De stappen die Faceted Search doorloopt tijdens het uitvoeren van een zoekopdracht. 16 van 50 2011 Seneca B.V. Alle rechten voorbehouden

11 Doorzoeken van verschillende contentsoorten In Smartsite ixperion kunnen zeer diverse soorten content worden beheerd. Contenttypen worden gedefinieerd voor verschillende soorten informatie: nieuwsberichten, vacatures, producten, adreskaarten kennen ieder hun eigen samenstelling en template, in Smartsite contenttypen genoemd. Daarnaast kunnen nog andere tabellen met informatie voorhanden zijn, die over het algemeen niet direct een representatie hebben als een webpagina. Te denken valt aan evenementen, reacties op pagina s (zogenaamde item comments), blog entries, forumbijdragen et cetera. Ieder van deze informatiebronnen kan worden toegevoegd aan Smartsite ixperion Faceted Search om te worden doorzocht. Deze contenttypen kunnen vervolgens bijvoorbeeld als facet worden afgebeeld, zodat de bezoeker een nadere selectie kan maken. 17 van 50 2011 Seneca B.V. Alle rechten voorbehouden

12 Zoeken in documenten Een groot deel van de informatie in een website is content, die bijvoorbeeld als XHTML wordt gepubliceerd. Maar ook documenten in PDF formaat, in Microsoft Office of OpenOffice formaat, moeten kunnen worden doorzocht. Smartsite ixperion slaat dergelijke documenten op in haar content repository als zogenaamde binaries. Door documenten in het CMS zelf op te slaan wordt geregeld dat geen ongeautoriseerde bewerking c.q. publicatie of raadpleging kan plaatsvinden. Aldus opgeslagen documenten kunnen vervolgens worden doorzocht. Daarbij wordt gebruik gemaakt van robuuste IFilter technologie 7. In sommige gevallen wordt een groot aantal documenten op schijf opgeslagen, bijvoorbeeld bij een export uit een documentmanagementsysteem (DMS). Ook alle documenten, die vanuit het CMS worden gelinkt, kunnen met Smartsite ixperion Faceted Search worden doorzocht. Om relatief grote aantallen bestanden op schijf te ontsluiten vanuit Smartsite kan een geautomatiseerd proces ingericht worden, dat voor een bepaalde mappenstructuur een equivalente structuur van FileLinks in Smartsite ixperion aanmaakt (en bij toevoegingen, aanpassingen of verwijderingen de structuur synchroniseert). Het gebruik van FileLinks biedt ten opzichte van direct op schijf aanwezige documenten het voordeel dat toegang tot de documenten via Smartsite verloopt (en de toegangsrechten dus navenant ingesteld kunnen worden) en de folder, waarin zich de fysieke documenten bevinden, niet via een URL direct toegankelijk hoeft te zijn. 7 Het database systeem gebruikt IFilter technologie. Voor veel bestandsformaten worden standaard IFilters meegeleverd bij het RDBMS, voor andere bestandsformaten zijn IFilters commerciëel of als freeware of open source beschikbaar. 18 van 50 2011 Seneca B.V. Alle rechten voorbehouden

13 Doorzoeken van afbeeldingen Afbeeldingen, bijvoorbeeld in de vorm van JPG, kunnen metainformatie bevatten, onder meer in het XMP- of EXIF-formaat. Deze metainformatie omvat dan bijvoorbeeld type van de camera, datum van de opname, gegevens over lens en sluitertijd, GPS coördinaten, maar kan ook worden uitgebreid met allerlei tags voor thema, locatie et cetera. Voor een uitgebreide beschrijving hiervan zie het whitepaper over de Smartsite ixperion Search Engine Optimization Toolkit. Deze metainformatie kan op vergelijkbare wijze worden doorzocht als de informatie in bijvoorbeeld Microsoft Word of Adobe PDF documenten, indien het gebruikte RDBMS een daarvoor geëigend filter (IFilter) heeft geïnstalleerd. Er zijn verschillende commerciële en freeware IFilters beschikbaar 8. Bij het weergeven van een afbeelding is het dan wel prettig als diezelfde metainformatie (bijvoorbeeld als een automatisch gegenereerde caption) kan worden getoond, zodat de zoeker kan kennisnemen van de betreffende metainformatie. Dit laatste is met behulp van standaard site building technieken en de Smartsite ixperion Search Engine Optimization Toolkit overigens eenvoudig mogelijk 9. 8 In de demo-omgeving, die werd gebruikt voor het illustreren van dit whitepaper, werd een component van Aimingtech gebruikt. 9 Om de metagegevens van een afbeelding weer te geven, kan gebruik worden gemaakt van de features van de SEO Toolkit. Hieronder worden de gegevens van een serie images (opgeslagen in de buffer imgs ) uitgelezen en in een geneste tabel geplaatst. <!-- Display all available images in a table, with their meta data --> <se:imageproperties inputdata= imgs > <se:parameters> <se:parameter name= format > <se:rowformat> <!-- Report the meta of the image --> <se:colformat expression= this.colname()!= Metadata ><tr><td>{this.colname()}</td><td>{this.field()} </td></tr></se:colformat> <se:rowresult> <tr> <td> <a href= {this.location()} ><img src= {url.addparameter(html.location(this. location()), hid, img;w=300; )} alt= Klik voor een grotere afbeelding /></a><br />{this.location()} </td> <td> <table><thead><th>eigenschap</th><th>waarde</th></thead><tbody>{this.rowresult()} </tbody></table> {imagemetadetailsintable(url.getitemnumber(this.location()))} </td> </tr> </se:rowresult> </se:rowformat> </se:parameter> <se:parameter name= resultformat > <table>{this.result()}</table> </se:parameter> </se:parameters> </se:imageproperties> 19 van 50 2011 Seneca B.V. Alle rechten voorbehouden

14 Zoeken in andere bronnen Vanzelfsprekend doorzoekt Smartsite ixperion Faceted Search de in Smartsite opgeslagen content. Maar ook informatie, die in andere bronnen is opgeslagen, kan worden doorzocht. Daarbij speelt wel steeds de vraag een rol hoe een zoekresultaat uit bijvoorbeeld een database tabel zinvol kan worden weergegeven. 14.1. Database tabellen Stel dat een bedrijf in het verleden al haar producten in een tabel in een database heeft opgeslagen. Alle bouten, moeren, nippels en ringen die de groothandel levert staan in deze database (en worden misschien wel beheerd in een ERP-systeem). Om deze producten nu te ontsluiten, is het alleen maar nodig om in Smartsite ixperion Faceted Search een aanvullende bron te specificeren en een passende weergave van een regel uit de betreffende bron toe te voegen. 14.2. User Generated Content Het doorzoeken van de formele content van een website kan worden aangevuld met het doorzoeken van user generated content (zoals commentaar bij artikelen 10, of blogs en forumcontributies). Dit werkt op vergelijkbare wijze als bij database tabellen. Het bijzondere van commentaar bij artikelen is dat bij het weergeven van het commentaar idealiter het oorspronkelijke artikel wordt afgebeeld met alle door bezoekers geplaatste opmerkingen. 10 In Smartsite ixperion worden hier Item Comments voor gebruikt. Deze worden niet in de gewone content hiërarchie opgeslagen, maar in een separate tabel. 20 van 50 2011 Seneca B.V. Alle rechten voorbehouden

15 Zoeken en mobiele kanalen Mobiel internet stelt steeds meer eisen aan uw website. Het inrichten van een specifiek kanaal voor mobiel internet is weliswaar in Smartsite ixperion eenvoudig te realiseren, maar om effectief te kunnen navigeren via een Smartphone zijn speciale hulpmiddelen gewenst. Zoeken kan naast een basisnavigatie de meest geschikte navigatievorm zijn op een mobiel kanaal; Smartsite ixperion Faceted Search is leent zich daartoe uitstekend. 21 van 50 2011 Seneca B.V. Alle rechten voorbehouden

16 Zoeken in een beveiligde omgeving Rollen en rechten Smartsite ixperion kent een zeer uitgebreid model van rollen en rechten. Zo kan fijnmazig de toegang tot relevante of gevoelige informatie worden afgestemd op de functie van de betreffende medewerker. Smartsite ixperion Faceted Search kent deze indeling in rollen en rechten en zal deze ook respecteren bij het doorzoeken van de webomgeving. Generieke zoekmachines kennen beperkingen ten aanzien van het zoeken in (gedeeltelijk) beveiligde omgevingen. Twee voorbeelden maken dit duidelijk. Een webomgeving met een publieke internetsite en een besloten gedeelte (voor bijvoorbeeld leden) wordt doorzocht. Een zoekopdracht van een bezoeker van de publieke website mag nooit resultaten opleveren uit het besloten gedeelte; omgekeerd zal de zoekopdracht van een ingelogde bezoeker van het besloten gedeelte zowel besloten als publieke resultaten tonen; besloten / openbaar kan in dat specifieke geval als een afzonderlijk facet worden getoond. In een wat complexer intranet zijn mogelijk verschillende bezoekersrollen gedefinieerd. Sommige content is bedoeld voor alle medewerkers, andere content alleen voor medewerkers van een bepaalde afdeling en ten slotte heeft het management een eigen verzameling content aangelegd (in de praktijk komen veel complexer scenario s voor, maar het principe wordt hiermee geïllustreerd). Een zoekopdracht van een medewerker levert resultaten op in de bedrijfsbrede content en in de informatie van zijn eigen, specifieke, afdeling; een manager kan alle bedrijfsbrede content doorzoeken, aangevuld met afdelingsspecifieke en managementinformatie. 22 van 50 2011 Seneca B.V. Alle rechten voorbehouden

17 Contextgevoelig zoeken Vanuit ergonomisch perspectief mag van een zoekfunctie worden verwacht dat deze contextgevoelig is. Met andere woorden: dat deze zich als het ware bewust is van de plaats in de website, van waaruit de zoekfunctie werd aangeroepen. Een bezoeker van een website, waarop elektronische apparatuur wordt aangeboden, zal bij een zoekopdracht op de homepage resultaten verwachten uit de gehele website, met andere woorden: uit de gehele verzameling aangeboden informatie. Is de bezoeker echter tijdens het navigeren in de sectie met digitale camera s beland, dan ligt het voor de hand dat primair resultaten die betrekking hebben op die sectie worden afgebeeld. Smartsite ixperion Faceted Search is zodanig ontworpen dat het op meerdere plaatsen in de website in andere verschijningsvormen kan worden ingezet en de scope van te doorzoeken informatie eenvoudig kan worden geconfigureerd. Hierbij kan worden gedacht aan subtrees (een deel van de hiërarchische structuur waarin de content is opgeslagen; een subtree zou kunnen overeenkomen met een subsite), kanalen, contenttypen et cetera. 23 van 50 2011 Seneca B.V. Alle rechten voorbehouden

18 Invloed uitoefenen op de ranking van zoekresultaten Het beïnvloeden van zoekresultaten bij internet zoekmachines zoals Google en Bing middels zoekmachineoptimalisatie van websites (SEO of Search Engine Optimization) is weliswaar mogelijk, maar de mechanismen daarvoor zijn constant aan verandering onderhevig en niet transparant. Daarbij bestaat er een inherente wantrouwensrelatie tussen de beheerders van de internet zoekmachines en de beheerders van uw website; de eersten waken voor objectiviteit in de bepaling van rankings tussen verschillende websites, en de tweeden hebben als doel om die rankings zo positief mogelijk in het voordeel van hun websites te beïnvloeden. Het sturen van de ranking van zoekresultaten binnen uw eigen website is echter van een geheel andere orde: het bovengenoemde belangenconflict bestaat hier nu niet. Daarom biedt Smartsite ixperion Faceted Search een groot aantal mogelijkheden om invloed uit te oefenen op de volgorde waarin zoekresultaten worden weergegeven. Het algemene principe is hierbij dat een zoekopdracht in de index een aantal fictieve punten oplevert. Dit mechanisme is ingebed in de onderliggende database zoektechnologie. Hierover is veel externe literatuur beschikbaar 11. De ranking wordt onder meer beïnvloed door: Exacte match van zoekterm en woorden in de tekst Woorddichtheid (hoe vaak komt het gezochte woord voor in de tekst) Woordnabijheid (hoe dicht staan twee zoektermen bij elkaar). De beheerder kan zijn invloed doen gelden door, wanneer een content item in de zoekresultaten voldoet aan speciale vooraf geformuleerde voorwaarden, dit aantal punten met een bepaalde waarde te verhogen. Het opstellen van deze bijzondere voorwaarden vereist zowel inzicht in de informatiestructuur van de website als in de wensen van de verschillende doelgroepen van de website. De uiteindelijke volgorde waarin de zoekresultaten worden afgebeeld, wordt bepaald door de hoogte van dit aantal punten. Die uiteindelijke ranking wordt genormaliseerd voor de totale set zoekresultaten (d.w.z., teruggebracht tot een waarde tussen 0 en 1). Omdat binnen een website meerdere instanties van Smartsite ixperion Faceted Search kunnen worden geplaatst (homepage, landing pages, subsites), kan de sturingsset voor weging ook per instantie worden bepaald. 18.1. Contenttype en bronveld De beheerder van de zoekomgeving van de website kan bepalen of het wenselijk is dat in het algemeen nieuwsberichten hoger of lager scoren dan evenementen of beleidsstukken, productbeschrijvingen of blog posts. Daarnaast kan worden bepaald dat het voorkomen van de zoekterm in de titel van het artikel hoger wordt gewaardeerd dan in de korte of lange beschrijving. Ook kan worden gekozen om de metadata hier zwaar te laten meewegen. Waar Google deze metawaarden volledig buiten beschouwing laat, zijn er kansen te over om in een Smartsite ixperion omgeving deze metadata, die bewust en gericht is toegevoegd door gewetensvolle, zorgvuldig werkende redacteuren, te benutten en de zoekresultaten zodoende te verbeteren. De instellingen voor deze parameters kunnen overigens het best worden bepaald door iemand die de informatiearchitectuur van de volledige website en eventuele subsites goed doorgrondt. Het gewicht van afzonderlijke velden in het contenttype wordt ingesteld via de Faceted Search Console. De sturingsset van de instantie van de Smartsite ixperion Faceted Search bevat een parameter contenttypeweight, waarmee de rating van contenttypen kan worden beïnvloed. 11 Zie http://msdn.microsoft.com/en-us/library/ms142524.aspx voor een overzicht van de uitgangspunten en algoritmes voor de bepaling van een ranking in Microsoft SQL Server 2008 R2. 24 van 50 2011 Seneca B.V. Alle rechten voorbehouden

Figuur 10. Gewicht van afzonderlijke velden kan naast veel andere parameters en instellingen - worden bepaald in de Faceted Search Console. 18.2. Leeftijd Sturing op basis van actualiteit is mogelijk: gekozen kan worden op de nieuwste content relatief hoger te waarderen dan oudere content. De sturingsset van de instantie van de Smartsite ixperion Faceted Search bevat hiervoor een parameter agefactor. In veel gevallen kan het wenselijk zijn een lichte beïnvloeding van de ranking te creëren door de leeftijd van het content item mee te wegen. 18.3. SEOPriority De beide hiervoor beschreven instellingen zijn voor groepen content van toepassing; de instelling middels SEOPriority (een verplicht veld in ieder content item, dat in waarde kan variëren tussen 0 en 1) biedt de mogelijkheid op basis van individuele content items de onderlinge ranking te beïnvloeden. De overeenkomstige parameter in de sturingsset is eveneens genaamd seopriority. Een woord van waarschuwing is hier op zijn plaats: als iedere redacteur alle door hem geplaatste content voorziet van de hoogst mogelijke SEOPriority in de hoop daarmee eigen content items sneller te laten verschijnen in zoekresultaten, is deze werkwijze niet aan te bevelen. In een redactiestatuut kan bijvoorbeeld worden vastgelegd hoe om te gaan met deze vrijheidsgraad. Een andere mogelijkheid is het toekennen van de SEOPriority over te laten aan een specifieke rol. 18.4. Beïnvloeding door gebruik Moeten veel geraadpleegde content items hoger scoren in de ranking? Dat kan in sommige situaties een logische keuze zijn. De sturingsset heeft hiervoor de factor popularityweight beschikbaar. Hiermee kan de aanname worden gehonoreerd dat veel geraadpleegde content items een hogere relevantie kunnen hebben voor bezoekers. 18.5. Configuratie van afzonderlijke gewichten De hiervoor genoemde factoren kunnen bij de inrichting initieel vrij worden gekozen en op basis van opgedane ervaringen geleidelijk worden aangepast. Hieronder wordt een stukje uit de configuratie (Query Definition XML) van een instantie van Smartsite ixperion Faceted Search getoond, in de sectie source. <weights default= 1 agefactor= 0.05 seopriority= 200 contenttypeweight= 200 popularityweight= 300 /> Dit voorbeeld illustreert dat bovenop de ranking die uit de onderliggende database terugkomt - een aantal toeslagen en factoren kan worden benut voor de betreffende bron. De agefactor zorgt ervoor dat nieuwere berichten een hogere ranking krijgen en seopriority zorgt ervoor dat de door een redacteur ingestelde SEOPriority maximaal 200 bonuspunten in de ranking oplevert. Evenzo beïnvloeden contenttype en populariteit de totale score met respectievelijk 200 en 300 punten. Eerder is al aangegeven dat de volgorde, waarin de resultaten worden weergegeven, wordt bepaald door de aldus bepaalde ranking. Na bepaling van de volgorde wordt de ranking van ieder zoekresultaat genormaliseerd, dus herleid naar een waarde tussen 0 en 1. 25 van 50 2011 Seneca B.V. Alle rechten voorbehouden

19 Management information over zoeken Als website beheerder heeft u vragen over het gebruik van uw website en de zoekmogelijkheden. Vragen die u helpen uw website steeds verder te verbeteren zijn onder meer: Hoeveel zoekopdrachten worden per dag in uw website uitgevoerd? Welke zoektermen zijn populair (en waarom is er misschien geen goede andere navigatiemogelijkheid aanwezig naar deze informatie; moet ik misschien een hyperlink op de homepage aanbieden naar een relevante (landings-)pagina over dit onderwerp)? Zijn er zoektermen waarvoor geen resultaten werden gevonden (en is dat terecht of kan dit worden opgevat als een aanleiding om relevante informatie te publiceren)? Smartsite ixperion Faceted Search biedt een volledige administratie van uitgevoerde zoekopdrachten. Daaruit kunnen bijvoorbeeld met Smartsite Management Information dagelijks of wekelijks nuttige rapporten worden gegenereerd, maar ook vormt deze administratie de bron voor de zogenaamde AutoCompletion mogelijkheid van Smartsite ixperion Faceted Search. Figuur 11. Standaard rapportages in Smartsite Management Information. 26 van 50 2011 Seneca B.V. Alle rechten voorbehouden

20 Search Enhancements Om te zorgen dat resultaten worden geboden, ook als de zoekopdracht onvolledig is, worden verschillende mogelijkheden tot verrijking geboden. Sommige mogelijkheden zijn als het ware ergonomisch van aard leiden met andere woorden sneller tot een resultaat terwijl andere mogelijkheden meer taalkundig van aard zijn en leiden tot een hogere kwaliteit van de zoekresultaten. 20.1. Sneller naar een resultaat De al eerder beschreven faceted search mogelijkheid valt vanzelfsprekend in deze eerste categorie. In plaats van voorafgaand aan een zoekopdracht allerlei complexe filteropties aan te kruisen (waarvan het effect pas achteraf blijkt), kan nu snel in de resultaten worden gefilterd. Een faciliteit die helpt nog sneller te zoeken is Autocompletion. Autocompletion van zoekopdrachten kent de bezoeker van de website al van zijn ervaringen met Google. Niet de volledige zoekopdracht behoeft meer te worden ingevoerd, maar de gebruiker kiest een zoekopdracht uit een lijst. De voorstellen in deze lijst worden getoond op basis van eerder daadwerkelijk uitgevoerde zoekopdrachten, die leidden tot een of meer zoekresultaten. Door de keuze van een via Autocompletion aangevulde zoekopdracht zal altijd een resultaat kunnen worden geboden. Figuur 12. Autocompletion van zoekopdrachten, met tussen haakjes het aantal keren dat de zoekopdracht is uitgevoerd en een indicatie van het aantal resultaten. Naarmate het aantal uitgevoerde zoekopdrachten toeneemt, zal ook de suggestiemogelijkheid waardevoller worden. Zo wordt een zelflerende zoekomgeving gerealiseerd. 20.2. Naar een beter resultaat In deze categorie Search Enhancements vallen functies die proberen de zoeker te begrijpen; door de zoekopdracht te verbeteren of aan te vullen worden nuttige resultaten aangeboden. 20.2.1. Thesaurus Een thesaurus zorgt ervoor dat de zoekopdracht automatisch wordt verrijkt met extra zoektermen. Wordt gezocht op rijwiel, dan wordt ook direct op fiets (een synoniem, dat als gelijkwaardige term wordt behandeld) gezocht. Ook kunnen op deze wijze spellingsvarianten (of veel voorkomende spelfouten) worden gerelateerd aan de voorkeurszoekterm ( kompressor wordt dan compressor ). Het beheer van deze thesaurus heeft logischerwijs plaats op basis van de voortgaande analyse van uitgevoerde zoekopdrachten. Als daaruit blijkt dat een bepaalde veel gebruikte zoekterm geen resultaten oplevert, kan door middel van een goedgekozen thesaurusrelatie alsnog een zoekopdracht met betekenisvolle resultaten ontstaan. Het is belangrijk dat de beheerder van de zoekomgeving goed gevoed wordt met informatie om de benodigde aanpassingen in de database thesaurus uit te voeren. Deze input kan bijvoorbeeld worden geleverd door redacteuren en marketeers. De thesaurus, die hiervoor gebruikt wordt in Microsoft SQL Server, maakt onderdeel uit van de database beheeromgeving en is globaal voor alle gebruikte database instanties; dit betekent dat het in het geval van meerdere databases mogelijk slechts beperkt zinvol is om van deze optie gericht en actief gebruik te maken. Per taal kan een thesaurus gebruikt worden. Voor meer details over het gebruik van thesauri in deze omgeving zie noot 12. 12 Voor Microsoft SQLServer 2008 thesaurusconfiguratie zie http://msdn.microsoft.com/en-us/library/ms142491. aspx. Het bestand tsglobal.xml en de thesaurusbestanden voor specifieke talen bevinden zich in de installatiedirectory, bijvoorbeeld in C:\Program Files\Microsoft SQL Server\MSSQL10.SQLSERVER2008\MSSQL\FTData en C:\ Program Files\Microsoft SQL Server\MSSQL10.SQLSERVER2008\MSSQL\Binn\Templates. Deze bestanden kennen hun eigen specifieke formaat. Aanpassen van een thesaurusbestand heeft pas effect als het thesaurusbestand daarna wordt geladen. Dat gebeurt bij het starten van het systeem, maar kan geforceerd worden door het uitvoeren 27 van 50 2011 Seneca B.V. Alle rechten voorbehouden

Het is mogelijk het beheer van de zoekthesaurus in Smartsite uit te voeren. Hiervoor wordt tijdens de installatie van Smartsite ixperion Faceted Search een thesaurus toegevoegd, die met de standaard Smartsite functies kan worden beheerd. De synchronisatie van deze thesaurus naar de Microsoft SQL Server omgeving is een handmatige operatie voor een beheerder. Ter illustratie is in de voorbeeldomgeving een thesaurusrelatie gelegd tussen airplane en ship. Zoeken op airplane geeft nu zoekresultaten waarin het woord ship voorkomt (en niet het woord airplane ). Figuur 13. Zoeken op airplane levert nu ook zoekresultaten op met de zoekterm ship. 20.2.2. Word breakers en Stemmers Word breakers en Stemmers bieden linguïstische functies op geïndexeerde informatie. Zij zorgen er bijvoorbeeld voor dat vervoegingen van woorden ook herkend worden. Een word breaker bepaalt grenzen in woorden en herkent zo de afzonderlijke woorden tuin en huis in tuinhuis. Een word breaker is geënt op taalspecifieke uitgangspunten. Bij het zoeken naar het woord lopen in het Nederlands voegt de stemmer een aantal gelijkwaardige varianten toe: loopt, liep, gelopen. Vanzelfsprekend is deze stemming bepaald door de taalkeuze 13. In meertalige omgevingen kan het wenselijk zijn om bijvoorbeeld een Franstalige zoekomgeving te hebben naast een Nederlandstalige en een Engelstalige. Voor iedere taal wordt dan een afzonderlijke index aangelegd, op basis van de stemmers voor de afzonderlijke talen. Figuur 14. De Word Breaker functie in actie: de zoekopdracht op command levert ook commander en commands op. 20.2.3. Stoplists Een stoplist, soms ook wel blacklist genaamd, bevat woorden die uit de zoekopdracht worden gefilterd (stopwoorden). Naast ongewenste zoektermen zijn dit ook nietszeggende zoektermen, voorzetsels, telwoorden et cetera. Smartsite ixperion Faceted Search gebruikt de in de RDBMS opgenomen stoplist 14. Deze stoplist kan direct vanuit de Faceted Search Console in de Smartsite Manager worden bewerkt. Wanneer een woord gefilterd wordt uit de zoekopdracht, wordt dit standaard gemeld aan de gebruiker. van een een stored procedure, zie http://msdn.microsoft.com/en-us/library/cc280598.aspx. De thesaurus voor Micosoft SQL Server kent twee vormen van nodes: expansions en replacements. Synoniemen worden ondergebracht in een <expansion> node. Zoeken op een van de termen in een expansion node levert automatisch ook zoekopdrachten op de andere termen in dezelfde expansion node op. Het thesaurusbeheer kan worden ondergebracht in een Smartsite thesaurus. Deze kan via enkele handmatige acties dan worden gesynchroniseerd met de Micosoft SQL Server thesaurus. Zie hiervoor http://docs.ixperion. smartsite.nl/doc/ixperion/add-on_modules/faceted_search/fs_reference/using_native_thesauri_in_faceted_search.html. 13 Het kiezen van de juiste taal voor de word breaker en stemmer functies is cruciaal. Voor meer informatie over hoe dit te doen zie http://msdn.microsoft.com/en-us/library/ms142509.aspx. 14 Zie http://msdn.microsoft.com/en-us/library/ms142551.aspx 28 van 50 2011 Seneca B.V. Alle rechten voorbehouden

Figuur 15. De stopwoordenlijst (Nederlands). Figuur 16. Het stopword the is verwijderd. 20.2.4. Did you mean... Een kleine spelfout en de zoekopdracht levert geen resultaten op. Dit kan worden voorkomen middels zoeksuggesties, die wel resultaten opleveren. Deze ontstaan door het feitelijke gebruik van de zoekomgeving door echte bezoekers, zodat de relevantie van de zoeksuggesties hoog is. Figuur 17. Did you mean... alternatieve zoekopdrachten worden onder de aandacht gebracht. 20.2.5. Zoeken binnen resultaten Een zeer effectieve ergonomische mogelijkheid is om te zoeken in de set van zoekresultaten van de voorgaande zoekopdracht. In een overheidswebsite wordt bijvoorbeeld eerst gezocht op vergunning. Als dit, zoals verwacht mag worden, vele duizenden resultaten oplevert, kan vervolgens binnen deze set van resultaten verder worden gezocht, bijvoorbeeld met de term dakkapel. Zo wordt de zoekopdracht specifieker gemaakt en zal het aantal resultaten afnemen tot een overzichtelijker aantal. Deze verdiepingsslag kan overigens herhaald worden. De uiteindelijke zoekopdracht is equivalent met het zoeken naar alle zoektermen, maar de hier beschreven faciliteit heeft als voordeel dat het aantal zoekresultaten geleidelijk aan kan worden teruggebracht door een nieuwe zoekterm toe te voegen. 29 van 50 2011 Seneca B.V. Alle rechten voorbehouden

Figuur 18. Eerst is gezocht op ship, daarna is search within results aangevinkt en wordt gezocht op fish. Dit is equivalent met de zoekopdracht ship fish. 30 van 50 2011 Seneca B.V. Alle rechten voorbehouden

21 Faceted Search in een kennisomgeving Smartsite ixperion Faceted Search kan heel goed worden ingezet als strategisch element in een kennissysteem. In een kennissysteem bestaan een aantal vaste navigatiemethoden: het systeem wordt immers gebruikt door specialisten. Maar ook de ongeordende toegang tot de schatkamer aan informatie door middel van intelligent zoeken is mogelijk. Onderstaande paragrafen bieden enkele toegevoegde voordelen van Smartsite ixperion Faceted Search is kennisgeoriënteerde omgevingen. 21.1. Zoekopdrachten opslaan In een kennisintensieve omgeving worden soms complexe zoekopdrachten samengesteld, die met enige regelmaat herhaald worden. Het ligt dan ook voor de hand dat dergelijke zoekopdrachten moeten kunnen worden opgeslagen. Smartsite ixperion Faceted Search maakt daarbij onderliggend gebruik van het Smartsite Personalization Framework. Figuur 19. Zoekopdrachten kunnen worden opgeslagen voor hergebruik op een later moment. Of een zoekopdracht kan worden opgeslagen en weer opgehaald, wordt bepaald door de aanwezigheid van een Smartlet in de configuratie van de zoekpagina: {sml_facetedsearch_persist()} 21.2. Zoekopdrachten regelmatig laten uitvoeren De voorsprong van kennisgeoriënteerde organisaties is vooral gelegen in de snelheid waarmee informatie kan worden gedistribueerd, bijvoorbeeld naar vakspecialisten en tussen specialisten onderling. Door een zoekopdracht, die zo is samengesteld dat deze het domein beschrijft van de betreffende specialist, dagelijks geautomatiseerd te laten uitvoeren, kan nieuwe informatie direct worden beschikbaar gemaakt. De volgende stap is dat deze informatie wordt toegestuurd aan een groep geïnteresseerden. Dat kan bijvoorbeeld in de vorm van RSS Feeds of al dan niet gepersonaliseerde elektronische nieuwsbrieven samen te stellen. Ook hierbij kan het Smartsite Personalization Framework nuttige diensten bewijzen. 21.3. Faceted Search als primaire navigatie hanteren In de inleiding werd al gesteld dat zoeken het nieuwe navigeren is. Het is in sommige gevallen denkbaar dat dit letterlijk geïmplementeerd wordt. Faceted Search kan namelijk zo worden geconfigureerd, dat een lege zoekopdracht mag worden afgevuurd (middels de parameter allowemptysearch ). Dit betekent, dat alle content direct ontsloten wordt (voor zover deel gemarkeerd als doorzoekbaar). Als voldoende relevante facetten zijn gedefinieerd, kunnen deze als het ware de rol overnemen van de klassieke navigatiemenu s. Of dit voor een specifieke omgeving tot een werkbare navigatie leidt, kan door middel van enig experimenteren eenvoudig worden vastgesteld. 31 van 50 2011 Seneca B.V. Alle rechten voorbehouden

22 Zoeken in meertalige omgevingen Zoeken in meertalige omgeving is een uitdaging. Met Smartsite ixperion Faceted Search kunnen meerdere instanties van de zoekomgeving worden gecreëerd (die ieder de voor de betreffende taal geschikte stemmer gebruiken en de juiste stopwoordenlijst), zodat per taal optimale resultaten worden gevonden. Een en ander vereist vanzelfsprekend wel dat per contenttype, per contentitem, per contenttype veld of per subtree op enige wijze bekend in welke taal de betreffende informatie is opgeslagen. Het inrichten van een zoekomgeving die in alle talen in een bepaalde omgeving tegelijk zoekt is weliswaar mogelijk, maar niet anders dan bij andere zoekomgevingen wordt dan een leidende taal voorondersteld. 32 van 50 2011 Seneca B.V. Alle rechten voorbehouden

23 Zoekfunctie voor redacteuren en developers In het redactieproces neemt de zoekfunctie een bijzondere plaats in. In het reguliere redactieproces zal regelmatig de wens aanwezig zijn om te zoeken, bijvoorbeeld om te bekijken of doublerende content ontstaat of juist elkaar tegensprekende informatie wordt gepubliceerd. Daarbij is de scope van een zoekopdracht groter, omdat de wens kan bestaan niet alleen in de actuele content te zoeken. Zo kan een redacteur behoefte kunnen hebben aan het doorzoeken van gearchiveerde content items, van items die nog niet of niet meer gepubliceerd worden, of aan het doorzoeken van voorgaande versies van documenten. Smartsite ixperion Faceted Search biedt ten opzichte van front end zoeken in de Smartsite Manager redactieomgeving een aantal aanvullende zoekfaciliteiten. Een speciale zoekpagina voor redacteuren doorzoekt deze bijzondere content vanzelfsprekend ook hierbij rekening houdend met de toegangsrechten van de betreffende webredacteur. Figuur 20. Redacteuren doorzoeken niet alleen actieve content, maar willen ook toegang hebben tot nog in voorbereiding zijnde content of al gearchiveerde content. Voor het doorzoeken van redactionele content is een afzonderlijke Search Group aangemaakt. Deze kan worden bekeken in de Smartsite ixperion Faceted Search Console. De onderliggende Query Definition XML bepaalt welke bronnen doorzocht worden. Developers vallen in een bijzondere categorie. Zij willen ten minste zoveel content doorzoeken als redacteuren in huidige, vervallen en toekomstige versies, maar willen daarnaast ook technische (SXML-)code kunnen zoeken en vinden. Voor deze groep wordt daarom een separate Search Group aangemaakt. Kenmerk van deze groep is dat ook contenttype velden, die technische codes bevatten, worden ontsloten. Vanzelfsprekend wordt ook voor deze zoekmodus rekening gehouden met de rechten van de gebruiker. 33 van 50 2011 Seneca B.V. Alle rechten voorbehouden

24 Technologie Smartsite ixperion Faceted Search maakt indien mogelijk gebruik van de kracht van de onderliggende relationele database systemen voor het snelle uitvoeren van zoekopdrachten. Er is naast een zogenaamde native SQL implementatie een tweetal specifieke implementaties beschikbaar voor Microsoft SQL Server 2005 en Microsoft SQL Server 2008. De Native implementatie is geschikt voor Oracle 10g en Oracle 11i. De daadwerkelijk beschikbare zoekfeatures zijn afhankelijk van de betreffende implementatie. Randvoorwaarde voor de inzet van Smartsite ixperion Faceted Search is Smartsite ixperion 1.3. Door middel van progressive enhancement maken Smartlets optimaal gebruik van de mogelijkheden die de browser biedt. Bij beschikbaarheid van Javascript hoeft bijvoorbeeld bij het bladeren door de zoekresultaten geen volledige page refresh plaats te hebben. Dit komt zowel de performance als de gebruikerservaring ten goede. Er wordt intensief gebruik gemaakt van deze Smartlet technologie en ook van de uitbreidingen in het Smartlet Client Framework, die het mogelijk maken events uit te wisselen tussen Smartlets. De configuratielaag in Smartsite ixperion Faceted Search levert alle input die nodig is om queries op de database samen te stellen. Deze queries zijn geoptimaliseerd voor het platform en worden samengesteld door het QueryBuilder macro. De zoekfunctie is vanzelfsprekend integraal beveiligd tegen misbruik (zoals SQL Injection). 34 van 50 2011 Seneca B.V. Alle rechten voorbehouden

25 Zoekopdrachten configureren De feitelijke zoekopdracht, die wordt uitgevoerd door Smartsite ixperion Faceted Search, wordt geconfigureerd in een Query Definition XML. De gegevens in dit bestand worden gelezen en bewerkt door een macro, dat uiteindelijk de query genereert en deze op de database afvuurt. De totale configuratie van een Faceted Search implementatie (en, zoals eerder gezegd, er kunnen er meerdere zijn binnen een website), wordt vastgelegd in dit XML bestand. De hoofdstructuur daarvan ziet er als volgt uit: <smartsite.facetedsearch> <configuration> </configuration> <sources> </sources> <facets> </facets> </smartsite.facetedsearch> De node <configuration> bevat naast gegevens als name en description de verwijzing naar de search group. Het belangrijkste onderdeel van deze node is echter de definitie van de zogenaamde master query. Dit is een template voor de query die behoort bij de betreffende search group. Dit template bevat Smartsite logica in de vorm van vipers. De node <sources> bevat, zoals de naam al doet vermoeden, de bronnen die doorzocht moeten worden. Per bron worden een of meer searchbases opgebouwd. Een searchbase bevateen of meer searchprofiles, de voor deze bron te hanteren gewichten en een query specificatie. De node <facets> ten slotte bevat alle gespecificeerde facetten. Een facet is relatief eenvoudig te definiëren. De belangrijkste onderdelen van een facet zijn facet_fields, search_fields, query en een where clause die de filterwerking van de facet voor haar rekening neemt. 35 van 50 2011 Seneca B.V. Alle rechten voorbehouden

26 Ondersteunde standaarden Smartsite ixperion Faceted Search is bedoeld voor brede toepassing. Het is daarom van belang dat relevante standaarden worden ondersteund. Tot deze standaarden behoren connectiviteit, uitwisselbaarheid en toegankelijkheid. Deze standaarden worden hieronder nader toegelicht. 26.1. OpenSearch OpenSearch is een standaard die het mogelijk maakt om zoekresultaten te delen tussen applicaties en machines 15. De standaard omvat onder meer een formaatdefinitie van de zoekopdracht en een definitie van het formaat van de zoekresultaten. Smartsite ixperion Faceted Search biedt op twee wijzen ondersteuning aan deze standaard. Smartsite ixperion Faceted Search kan middels OpenSearch door derden worden bevraagd. Een dergelijke query ziet er dan als volgt uit: http://www.mysite.com/open-search.xml?q=ship De resultaten daarvan worden dan bijvoorbeeld in Atom of RSS formaat geretourneerd: Figuur 21. De resultaten van een OpenSearch query. Anderzijds zouden de zoekresultaten van de Smartsite ixperion kunnen worden uitgebreid met zoekresultaten uit andere domeinen, die OpenSearch ondersteuning bieden. In dit geval is de Open- Search interface van een derde applicatie een van de te doorzoeken bronnen. Te denken is hierbij aan Microsoft Enterprise Search (Express). 26.2. Smartlets Smartlets zijn het Smartsite equivalent van portlets, webparts, widgets et cetera. Smartlets kenmerken zich door rijke, in zichzelf complete stukjes functionaliteit, die zeer eenvoudig kunnen worden uitgerold in andere delen van de site en daar verder toegespitst op de specifieke behoeften, of uitgerold in andere omgevingen. Smartlets bieden het grote voordeel van de rijke ondersteuning van het Smartsite Client Framework, zijn voorzien van progressive enhancement en zijn een toekomstvaste vorm van ontwikkeling. 15 Zie http://www.opensearch.org 36 van 50 2011 Seneca B.V. Alle rechten voorbehouden

26.3. Webrichtlijnen Alle interactie met de gebruiker verloopt via webpagina s, die samengesteld worden uit blokjes functionaliteit, zogenaamde Smartlets, die tezamen een zoek-, een resultaten- of een verfijningsfunctie bieden. De afzonderlijke Smartlets voldoen volledig aan de Webrichtlijnen en ook de uit meerdere Smartlets samengestelde webpagina s kunnen de toets van de Webrichtlijnen doorstaan. Als in de webbrowser ondersteuning voor Javascript niet aanwezig is (of is uitgeschakeld door de gebruiker) blijft de zoekmogelijkheid beschikbaar zonder verlies van functionaliteit. 26.4. Smartsite Personalization Framework Hoewel het Smartsite Personalization Framework niet noodzakelijk is voor de uitrol van Smartsite ixperion Faceted Search, biedt deze module wel veel extra mogelijkheden. Zo kunnen de zoekopdrachten van de bezoeker hierin worden bewaard (via het sml_facetedsearch_persist() Smartlet); maar het Framework biedt ook verdere uitgebreide mogelijkheden, die behavioral targeting kunnen ondersteunen. Dit valt echter buiten de scope van dit whitepaper. 37 van 50 2011 Seneca B.V. Alle rechten voorbehouden

27 Feature matrix Feature SQL Server 2005 SQL Server 2008 Oracle 10G / 11i Real-time zoeken ü ü ü ü Autocompletion ü ü ü ü Did you mean... ü ü ü ü Zoeken binnen resultaten ü ü ü ü Stoplist ü Thesaurus enrichment (Synoniemen) ü ü Native SQL Ondersteunde bestandsformaten.doc /.docx ü ü.xls /.xslx ü ü.ppt /.pptx ü ü.pdf ü ü.zip ü ü.odt (OpenOffice Document).odp (OpenOffice presentatie) Andere bestandformaten Middels diverse (third party) IFilter oplossingen Smartlets Zoekbox ü ü ü ü Resultaten met ranking en highlighting, iconen voor bestandsformaat ü ü ü ü Facetten ü ü ü ü Top X meeest uitgevoerde zoekopdrachten ü ü ü ü Tag Cloud meest gebruikte zoektermen ü ü ü ü Mijn zoekopdrachten ü ü ü ü Rapportages 16 Meest voorkomende zoekopdrachten ü ü ü ü Zoekopdrachten zonder resultaat ü ü ü ü 16 Smartsite Management Information 2.0 is hiervoor vereist. 38 van 50 2011 Seneca B.V. Alle rechten voorbehouden

28 Installatie en beheer Smartsite ixperion Faceted Search kan tegelijk met een installatie of update van Smartsite ixperion 1.3 worden geïnstalleerd. In een bestaande site kan Smartsite ixperion Faceted Search zo worden toegevoegd en direct worden gebruikt. Fine-tuning van de instellingen kan zo direct met een werkende omgeving als startpunt plaatsvinden. Een belangrijk instrument bij het beheer van Smartsite ixperion Faceted Search is de Faceted Search Console (zie hieronder). De belangrijkste parameters voor de sturing van de zoekmachine kunnen hier worden beheerd. Figuur 22. Smartsite ixperion Faceted Search Console. 39 van 50 2011 Seneca B.V. Alle rechten voorbehouden

29 Een literair voorbeeld Ter illustratie van de mogelijkheden wordt een webomgeving met veel literatuur (mede) ontsloten met behulp van Smartsite ixperion Faceted Search. Deze omgeving bevat vooral Engelstalige literatuur (gedigitaliseerd in het Gutenberg project). Het standaard zoekscherm in dit voorbeeld ingericht in de Engelse taal, maar vanzelfsprekend is dit een vrije keuze - wordt hieronder weergegeven. De stappen die noodzakelijk waren om tot deze inrichting te komen, worden aan het einde van dit hoofdstuk toegelicht. Figuur 23. Zoekscherm voor doorzoeken literaire content. We zien in dit scherm onder meer de volgende onderdelen: Zoekveld; hier wordt de zoekopdracht ingegeven Zoekknop; start de zoekopdracht Reset link; de eventueel eerdere opgebouwde zoekcontext wordt gewist Zoeken binnen resultaten Alleen zoeken in titels Geselecteerde filters Facetten voor jaar van oorspronkelijke publicatie, behandelde locatie, auteur, taal van publicatie en een lijst met meest populaire zoekopdrachten. Wat opvalt in dit scherm, is dat bij voorbaat de te doorzoeken collectie informatie al is beperkt: als geselecteerd filter is hier te zien dat alleen literaire content Om te beginnen wordt een eenvoudige zoekopdracht gegeven. Er wordt gezocht naar het woord ship en de 142 resultaten worden nu getoond, standaard in volgorde van relevantie. Per zoekresultaat wordt een passend icoon gebruikt om het type weer te geven (in dit specifieke geval voor webpagina s). Per resultaat wordt een abstract getoond, dat meestal ook de daadwerkelijke zoekterm zal bevatten. De zoekterm wordt middels highlighting uitgelicht in titel of abstract. Als het aantal zoekresultaten het maximum van een pagina overtreft, dan kan worden gebladerd in de resultaten. Omdat door de gebruikte progressive enhancement meestal geen volledige verversing van de webpagina noodzakelijk zal zijn, werkt het bladeren zowel snel als gebruiksvriendelijk. 40 van 50 2011 Seneca B.V. Alle rechten voorbehouden

Figuur 24. Eerste eenvoudige zoekopdracht: het woord ship. Figuur 25. Zoeken naar pass levert ook passing op. Het zoeken naar de term pass levert ook zoekresultaten op, waarin de zoekterm als onderdeel van een samengesteld woord voorkomt. Dit is het gevolg van zogenaamde Word breaker en Stemmer technologie, die op de achtergrond wordt toegepast. Deze technologie herkent onder meer samengestelde woorden (tuinhuis = tuin + huis), maar ook werkwoordsvormen en zal dus ook resultaten opleveren met afgeleide werkwoordsvormen. 41 van 50 2011 Seneca B.V. Alle rechten voorbehouden

Figuur 26. Zoekresultaten sorteren. De zoekresultaten kunnen op meerdere wijzen worden gesorteerd. De meest voor de hand liggende wijze is die op basis van relevantie. Maar ook andere criteria kunnen worden gehanteerd, bijvoorbeeld de chronologische volgorde waarin de informatie ooit is toegevoegd aan het systeem of is gepubliceerd. Een belangrijk hulpmiddel dat Smartsite ixperion Faceted Search biedt, is de mogelijkheid binnen zoekresultaten verder te zoeken. Ter illustratie wordt eerst een opdracht uitgevoerd met de zoekterm count. Dit levert in het onderhavige geval 193 resultaten op. Als nu de optie Search within results wordt aangevinkt en de zoekopdracht countess wordt opgegeven, dan wordt binnen de oorspronkelijke 193 resultaten verder gezocht. Dat levert dan nog slechts 79 resultaten op. Dit komt effectief natuurlijk overeen met een booleaanse zoekopdracht. Die zou hebben geluid: count AND countess, of, nog eenvoudiger, count countess omdat het standaard gedrag van Faceted Search de AND operatie is. In onderstaande scherm wordt de booleaanse zoekopdracht weergegeven, die functioneel vergelijkbaar is met het zoeken binnen een eerdere resultatenset. De schermafbeeldingen geven aan dat de set zoekresultaten van beide werkwijzen identiek is. 42 van 50 2011 Seneca B.V. Alle rechten voorbehouden

Figuur 27. Booleaanse zoekopdracht, in dit geval equivalent met het zoeken binnen eerdere resultaten. Figuur 28. Zoeken en vervolgens verfijnen door te zoeken binnen eerdere resultaten. 43 van 50 2011 Seneca B.V. Alle rechten voorbehouden

Figuur 29. De zoekopdracht is nu uitgevoerd binnen de eerdere resultaten. Smartsite ixperion Faceted Search bevat een aantal handige gebruikersfuncties. Een belangrijke is het automatisch aanbieden van zoektermen op basis van hetgeen al is ingegeven. Belangrijk is dan dat alleen zoektermen worden aangeboden die daadwerkelijk tot resultaten leiden. Vanzelfsprekend wordt ook getoond hoeveel resultaten bij die betreffende zoekopdracht te verwachten zijn. Deze lijst wordt getoond op basis van eerdere, daadwerkelijk uitgevoerde, opdrachten. Figuur 30. Autocompletion in actie. Een andere belangrijke functie is dat stopwoorden, veelgebruikte maar niet significante termen, niet als zoekopdracht worden geaccepteerd. In nevenstaande afbeelding meldt het systeem: Removed noise words: there. Om dit te kunnen doen houdt het systeem een bestand bij, dat redactioneel kan worden bewerkt. Dezelfde lijst kan bijvoorbeeld worden gebruikt om ongewenste zoektermen uit te sluiten. 44 van 50 2011 Seneca B.V. Alle rechten voorbehouden

Figuur 31. Filteren van stopwoorden. Figuur 32. Faceted Search Console. Een belangrijk onderscheidende kracht van Smartsite ixperion Faceted Search is de mogelijkheid om door middel van facetten de zoekresultaten verder te verfijnen. Het volgende voorbeeld maakt dit duidelijk. Als eerste wordt gezocht op de term connect. Dit levert 40 resultaten op. Door nu via een van de facetten aan de rechterzijde een verfijning aan te brengen, zal het aantal resultaten tot een lager (en voorspelbaar) aantal worden teruggebracht. Figuur 33. Start met zoeken op connect. 45 van 50 2011 Seneca B.V. Alle rechten voorbehouden

Figuur 34. Toepassen van het facet Location. Zou zouden bij keuze voor het publicatiejaar 1896 nog 25 resultaten resteren, bij keuze voor auteur Herman Melville nog 13 resultaten, en keuze voor de locatie London nog 2 resultaten. Om Faceted Search zo in te richten als in bovenstaande illustratie was een beperkt aantal stappen noodzakelijk. Onderstaand overzicht toont de belangrijkste handelingen op hoofdlijnen. 1. Kopieer een bestaand voorbeeld van Faceted Search uit de examples folder en plaats dit in een nieuwe folder. De SXML Logic van deze pagina is oorspronkelijk: <se:itemdata /> <se:placeholder.addcss> div.is_main, div.is_facets { float:left; } div.is_main { width:600px; } div.is_facets { width:200px; } div.is_main div.sml_box, div.is_facets div.sml_box { margin: 2px; } div.is_facets td {padding: 2px; } div.is_main td,div.is_main th {padding: 1px; } div.is_main th {padding-top: 4px; } </se:placeholder.addcss> <div> <div class= is_main > {sml_facetedsearch(options= nosearchwithin=1,nosearchprofile=1 )} </div> <div class= is_facets > {sml_facetedsearch_facet(facet=period, boxclass= collapsible )} {sml_facetedsearch_facet(facet=author, boxclass= collapsible )} {sml_facetedsearch_facet(facet=thesterms, boxclass= collapsible )} {sml_facetedsearch_facet(facet=searchterm_topx, options= allowemptysearch=1,search start=server, boxclass= collapsible )} </div> </div> 2. Allereerst willen we de zoekopdracht beperken tot een subset aan content. Dat kan bijvoorbeeld door middel van selectie van contenttypen of door toepassing van een subtree selectie. In dit geval wordt na de <se:itemdata> node het volgende blok JSON code toegevoegd. Vanaf dit moment wordt alleen de content doorzocht die zich in de al gedefinieerde Subtree van contentitem 1213 bevindt. De buffer filters zal daarna worden meegegeven bij de aanroep van het sml_facetedsearch Smartlet. 46 van 50 2011 Seneca B.V. Alle rechten voorbehouden

<se:buffer name= filters > { filters :{ subtree :{ selection :[ { key : 1213, name : Section Literature } ], list : rdonly } } } </se:buffer> {sml_facetedsearch(filters=$filters)} 3. Om aanvullende facets te definiëren dient de door deze instantie van Smartsite ixperion Faceted Search gebruikte Query Definition XML te worden aangepast. In het algemeen is aan te raden een kopie te maken van de oorspronkelijke, meegeleverde Query Definition XML (met de titel Publication ) en in de verdere configuratie hiernaar te verwijzen. In dit geval is de kopie voorzien van de code LITQUERY en wordt de aanroep van het Smartlet sml_facetedsearch als volgt aangepast: {sml_facetedsearch(filters=$filters, queryxml= LITQUERY )} 4. In de node <facets> is een facet toegevoegd dat geografische referenties afbeeldt. In de doorzochte contenttypen is een koppeling gelegd met een thesaurus ( GEO ) die geografische namen bevat en door redacteuren is gebruikt om content items te voorzien van geografische referenties. <!--// for literature contenttypes only --> <facet name= location enabled= true datatype= integer mode= andor allowinvert= false displayname= Location > <facet_fields>vt.nr as facetkey, vt.count, vt.name, ROW_NUMBER() OVER (ORDER BY vt.count DESC) AS rownum </facet_fields> <search_fields> c.nr </search_fields> <query><![cdata[ SELECT {this.facetselectfields()} FROM ( SELECT COUNT(*) AS Count, tt.nr, tt.name FROM ( {this.searchquery()} ) nvt JOIN ContentsThesTerms ctt ON nvt.nr=ctt.nrcontents JOIN ThesTerms tt ON ctt.nrthesterms= tt.nr JOIN Thesauri th ON tt.thesaurusnr=th.nr WHERE th.code= GEO GROUP BY tt.nr, tt.name ) vt ]]> </query> <joins/> <where> c.nr In (SELECT DISTINCT ctt.nrcontents FROM ContentsThesTerms ctt WHERE ctt.nrthesterms=?:location) </where> </facet> 47 van 50 2011 Seneca B.V. Alle rechten voorbehouden

5. Op soortgelijke wijze zijn andere metagegevens van de literaire contenttypen ontsloten in facets. Dit is gebeurd voor auteurs (voor de bewuste contenttypen is een auteurthesaurus gebruikt), voor de gepubliceerde taal (een koppeling met de LocaleCultures tabel in de Smartsite database) en voor het jaar van eerste publicatie (een numeriek veld in het contenttype). 6. De te tonen facets kunnen nu worden opgesomd in de zoekpagina: <div> <div class= is_main > {sml_facetedsearch(filters=$filters, queryxml= LITQUERY )} </div> <div class= is_facets > {sml_facetedsearch_facet(facet=publication, boxclass= collapsible )} {sml_facetedsearch_facet(facet=location, boxclass= collapsible )} {sml_facetedsearch_facet(facet=author, boxclass= collapsible )} {sml_facetedsearch_facet(facet=language, boxclass= collapsible )} {sml_facetedsearch_facet(facet=searchterm_topx, options= allowemptysearch=1,searchstart=server, boxclass= collapsible )} </div> </div> 48 van 50 2011 Seneca B.V. Alle rechten voorbehouden

Smartsite ixperion is een product van Seneca B.V. in Delft. Smartsite ixperion is de nieuwste versie van het succesvolle content management systeem Smartsite. Smartsite ixperion vertegenwoordigt meer dan tien jaar ervaring die Seneca in de Benelux heeft opgebouwd rond content management bij middelgrote en grote organisaties in onder meer de profit sector, bij overheden, in de woon- en zorgsectoren, bij opleidingsinstituten en bij leden- en belangenorganisaties. Voor meer informatie: www.smartsite.nl. Seneca B.V. Elektronicaweg 31 2628 XG Delft Nederland T +31(0)15-251 37 00 F +31(0)15-251 37 01 E info@seneca.nl I www.seneca.nl 2011, Seneca B.V.