:c Zoeken op WWW: Lycos revisited, Lycos NlightN'd en de WWW Worm



Vergelijkbare documenten
Korte Handleiding CINAHL

2019 SUNEXCHANGE USER GUIDE LAST UPDATED

Web of Science: SCI, SSCI en AHCI

Wanneer je al in Limo aan het werken bent, kan je scopus intypen in de zoekbalk en Databases / E-journals aanduiden.

Basisfunctionaliteit van gestructureerde zoeksystemen. Illustratie aan de hand van het zoeksysteem van Ebsco.

Het Automatic Term Mapping systeem van Emcare helpt Subject Headings te vinden. In paragraaf 2 wordt uitgelegd hoe dit werkt.

ANGSTSTOORNISSEN EN HYPOCHONDRIE: DIAGNOSTIEK EN BEHANDELING (DUTCH EDITION) FROM BOHN STAFLEU VAN LOGHUM

Internet Marketing Termen

Het beheren van mijn Tungsten Network Portal account NL 1 Manage my Tungsten Network Portal account EN 14

ZOEKEN MEDLINE COMPLETE

MyDHL+ Van Non-Corporate naar Corporate

MyDHL+ ProView activeren in MyDHL+

Handleiding. CROW Kennisbank. Contentmanagement

RECEPTEERKUNDE: PRODUCTZORG EN BEREIDING VAN GENEESMIDDELEN (DUTCH EDITION) FROM BOHN STAFLEU VAN LOGHUM

Hoe te verbinden met NDI Remote Office (NDIRO): Apple OS X How to connect to NDI Remote Office (NDIRO): Apple OS X

Deel 2: Endnote bibliografische software gebruiken als databasemanager en editor

OPDRACHTKAART. Thema: Multimedia. Het internet 3. Het World Wide Web MM Voorkennis: Geen.

Bronnen voor genderstudies

Verdien model. Affiliate marketing

MyDHL+ Tarief berekenen

Hardware Specialisatie. Module 1: Zoeken op het internet

MyDHL+ Uw accountnummer(s) delen

Scopus Zoeken in Scopus

Firewall van de Speedtouch 789wl volledig uitschakelen?

Bitrix Site Manager gebruikershandleiding BureauZuid

Settings for the C100BRS4 MAC Address Spoofing with cable Internet.

Jouw bedrijf in 3 stappen bovenin Google Whitepaper online vindbaarheid versie augustus 2012

Inhoud van deze handleiding

ECHTE MANNEN ETEN GEEN KAAS PDF

Als je naar ERIC gaat kom je automatisch bij Basic Search (eenvoudig zoeken).

Maillijsten voor medewerkers van de Universiteit van Amsterdam

Inhoud van deze handleiding

Bibliotheek Sociale Wetenschappen Introductie tot het zoeken Antropologie

Handleiding beheer lijst.hva.nl. See page 11 for Instruction in English

Embase. Het Automatic Term Mapping systeem van Embase helpt Subject Headings te vinden. In paragraaf 2 wordt uitgelegd hoe dit werkt.

ICT -idee 1. Om met Themeefy te kunnen werken moet je eerst een account aanvragen. Het aanvragen van een account is gratis en gaat als volgt.

LDAP Server on Yeastar MyPBX & tiptel 31xx/32xx series

Instellen Finchline Topics & Booleaans zoeken

Een handleiding bij het gebruik vind je door te klikken op de link Help : Handleiding LexisNexis Academic (=basis van tekst hieronder).

Handleiding Digipass DP310

Links controleren met Xenu s Link Sleuth

Handleiding. CROW Kennisbank. Contentmangement

EM7680 Firmware Update by OTA

Lists of words from the books, and feedback from the sessions, are on

Stappenplan zoeken en verwerken van informatie

EBSCO-databanken : Communication and Mass Media Complete, Green File & International Political Science Abstracts

Bibliotheek Sociale Wetenschappen Introductie tot het zoeken

Uitwerking vervolgopdrachten PsycInfo: tranquilisers voor de behandeling van schizophrenie bij jonge vrouwen

Hoe bouw ik een goede website?

Modulehandleiding VivianCMS. Zoeken

EndNote Web handleiding

Handleiding voor het zoeken in de NVBS-beeldbank

ZOEKEN IN SPORTDISCUS

SAMPLE 11 = + 11 = + + Exploring Combinations of Ten + + = = + + = + = = + = = 11. Step Up. Step Ahead

Hoe met Windows 8 te verbinden met NDI Remote Office (NDIRO) How to connect With Windows 8 to NDI Remote Office (NDIRO

Handleiding SEO controle & Publiceren blog-artikelen Wageningen UR blog. Oktober 2015

+DQGOHLGLQJYRRUKHW]RHNHQLQ

EM6250 Firmware update V030507

LIMO zoekt gedrukte EN elektronische publicaties - in de catalogi van de K.U.Leuven bibliotheken en de andere bibliotheken van Libisnet -in LIRIAS =

Handleiding LexisNexis NewsPortal

Ik heb Nederlandse Bronnen aangevinkt, maar krijg toch nog niet Nederlandse resultaten hoe kan dit?

General info on using shopping carts with Ingenico epayments

Zo kan je linken maken tussen je verschillende groepen van gegevens.

Handleiding Word Press voor de bewoners Westerkaap 1

EndNote X7 Quick Start guide Medische Bibliotheek september 2015

WebSite Director Gebruikersgids

Scopus Zoeken in Scopus

VAN HET VAGEVUUR IN DE HEL PDF

Bibliotheek Sociale Wetenschappen 2018

TAAL ACTIEF GROEP 8 SPELLING 2 PDF

1. Probleemstelling formuleren en sleutelwoorden bepalen.

Handleiding webalizer sitestatistieken

Faq Droogsurfen Jeroen Devlieghere Ine Callebaut

Bibliotheek Sociale Wetenschappen Introductie tot het zoeken Politieke wetenschappen

Handleiding registreren in de portal

Quickstart my_editors & MMBase

Archief Voor Kerkelijke Geschiedenis, Inzonderheid Van Nederland, Volume 8... (Romanian Edition)

DALISOFT. 33. Configuring DALI ballasts with the TDS20620V2 DALI Tool. Connect the TDS20620V2. Start DALISOFT

Stappenplan zoeken en verwerken van informatie

BIBLIOTHEEK SOCIALE WETENSCHAPPEN. Handleidingen

Web of Science (WoS) Social Sciences Citation Index, Arts & Humanities Citation IndexConference Proceedings Citation Index Social Science & Humanities

2. Openingspagina van PubMed en uitleg over de knoppen en opties

Hieronder volgt een overzicht van relevante contactpersonen binnen KPN.

EBSCO-databanken Communication and mass media complete; GreenFILE; ebook Collection

Handleiding Joomla 3.x

Handleiding voor Zotero versie 2.0

open standaard hypertext markup language internetprotocol transmission control protocol internet relay chat office open xml

Handleiding zoeken in de digitale kranten

ZO GAAT DAT IN RUSLAND PDF

Starten van de tool De tool wordt opgestart door een web browser te openen (bij voorkeur Google Chrome) en in de adresbalk te typen:

Taco Schallenberg Acorel

Dutch survival kit. Vragen hoe het gaat en reactie Asking how it s going and reaction. Met elkaar kennismaken Getting to know each other

Handleiding GRID Token

EBSCO-databanken Communication & Mass Media Complete; GreenFILE; ebook Collection

U kunt de helpbestanden op verschillende manieren openen. Standaard activeert u de helpbestanden via de toets F1.

SEO Content. Creditcard aanvragen? Dé beste creditcards vergelijken.

Basis handleiding CMS

JSTOR Zoeken in JSTOR

Plagiaatcontrole met Blackboard november 08

Transcriptie:

- Het Beazley Archief heeft een archeologische database met gegevens over ongeveer 52.000 Griekse vazen. Deze tekstuele database wordt al jaren online, via Internet, geraadpleegd door universiteiten en musea in grote delen van de wereld. Nu worden er in het kader van RAMA beelden aan toegevoegd. - Het Museum voor Cycladische Kunst is een archeologisch museum met een collectie kunstvoorwerpen van een beschaving die van 3200 tot 2000 voor Christus op de Cycladen-eilanden bloeide. - De onderwerpen van het Archeologisch Museum in Madrid zijn: 'juwelen door de eeuwen heen', Iberische en middeleeuwse beeldhouwkunst en Romeinse epigrafie. - De Antiquiteitenverzameling van het Pergamonmuseum tenslotte heeft gekozen voor Griekse, Etruskische en Romeinse antiquiteiten. - De Uffizi Galerie toont in RAMA schilderijen uit de Italiaanse Renaissance. De archeologische musea en de kunstmusea hebben vanwege hun verzamelgebieden een 'natuurlijke' belangstelling voor elkaar. Het Museon zal experimenteren met het Rijksinstituut voor Oorlogsdocumentatie en de Rijksdienst voor Kunsthistorische Documentatie. Het Musée d'orsay gaat met het Louvre gegevens uitwisselen. In Madrid werkt het Nationaal Archeologisch Museum samen met het Prado. :c Zoeken op WWW: Lycos revisited, Lycos NlightN'd en de WWW Worm Wie Weet Welke Wellicht Waardevolle Wijsheid Waar op het Web op ons Wacht deel 2 Eric Sieverts De snelle veranderingen bij Lycos geven alweer aanleiding in de serie Wie Weet... nog even op dat systeem terug te komen alvorens www Worm te bespreken. Het overzicht van zoekmachines is geactualiseerd en uitgebreid. In de eerste bijdrage aan deze serie heb ik het verschijnsel www-zoekmachine geïntroduceerd. Daarnaast ben ik uitgebreider ingegaan op één van die zoekmachines, namelijk LYCOS, en heb ik aan de hand daarvan verteld op welke manier veel van die machines via een soort robots hun informatie verzamelen. Bovendien gaf ik in die aflevering al een overzicht van adressen van andere zoekmachines die ik tot dat moment had achterhaald en die hopelijk later nog eens aan de orde zouden komen. Hopelijk kunnen we zo uiteindelijk tot een evaluerende vergelijking met plusen minpunten van al die systemen komen. Uit deze tweede bijdrage blijkt (voor de regelmatige Internet-gebruiker niet verrassend) wat een snel evoluerend en veranderend fenomeen het World Wide Web is. Recente veranderingen bij Lycos geven name- Dr. E. G. Sieverts is docent aan de Opleiding Informatiedienstverlening en -management (IDM) van de Hogeschool van Amsterdam. E-mail: e.g.sieverts@fei.hva.nl. lijk al weer aanleiding nog even op dat systeem terug te komen. Verder blijkt een aantal adressen (URL'S) uit het vorige overzicht van zoekmachines intussen ook veranderd te zijn. Bovendien kan nog een viertal nieuwe machines aan de lijst toegevoegd worden. Al met al een goede reden om de bijgewerkte lijst in deze aflevering opnieuw in zijn geheel op te nemen. Overigens begin ik me wel af te vragen of deze serie ooit zal eindigen, als bij elke aflevering waarin niet meer dan drie of vier zoekmachines uitgebreid aan de orde kunnen komen, ook weer vier nieuwe aan de verzamellijst toegevoegd worden! De andere deze keer te bespreken systemen zijn een 'nieuwe' en een 'oude'. De nieuwe, NlightN, wordt deze keer maar meteen opgenomen omdat daarmee twee ontwikkelingen geïllustreerd worden. Dit is in de eerste plaats een voorbeeld van een voor gratis gebruik opgezet zoeksysteem (het al besproken Lycos; helemaal nieuw is hij dus ook weer niet) dat nu door een commercile organisatie, deels tegen betaling, 52 L[SGIN(1995)4

wordt toegepast. In de tweede plaats wordt daarbij niet alleen informatie van www-pagina's aangeboden, maar worden ook al veel langer bestaande commerciële databases in één keer toegankelijk gemaakt. De oude zoekmachine die dit keer besproken wordt is de intussen al klassieke www Worm. Ook die heeft echter al weer een belangrijke face-lift ondergaan. Daarbij wordt meteen geïllustreerd hoe bij het zoeken in www üoms gebruik gemaakt kan worden van de structi: ur die HTML-documenten hebben, als alternatief voor in databases gebruikelijke veldstructuren. Wellicht ten overvloede zij nog vermeld dat ik bij mijn beschrijvingen uitga van de mogelijkheden die bij gebruik van een grafische www-browser als Mosaic of Netscape geboden worden. Zelf gebruik ik Netscape. Nogmaals Lycos Allereerst kan gemeld worden dat de Lycos database intussen (begin november 1995) al ca. n miljoen Webpagina s bijna full-text geïndexeerd heeft. En dat zou (naar eigen zeggen) ongeveer 91% van het web zijn, ongeveer vier keer zo veel als 'de nummer twee'. Het woord 'bijna' uit de eerste regel vereist nog enige nadere uitleg. In tegenstelling tot wat ik vorige keer schreef, blijkt Lycos toen niet echt de volledige tekst te indexeren, maar alleen de eerste circa 300 woorden (ongeveer 20 regels) uit elk www-document, plus aanvul end nog maximaal 100 andere woorden die het progra:nma op statistische gronden voor dat document h et meest kenmerkend acht. In de meeste gevallen is d at geen ernstige beperking. Alleen als echte artikelen en boeken full-text worden aangeboden, zal niet de volledige tekst afzoekbaar zijn. Dat betekent datje biij een zoekactie op ' bolshevism AND socrates niet het vierde hoofdstuk van Lady Chatterley's Lover (waarvan elk hoofdstuk een afzonderlijk www-document vormt) zult terugvinden, hoewel die beide woorden daarin wel voorkomen. 1 De keuze tussen de verschillende beschikbare Lycosservers, die in de vorige aflevering gemeld werd, is intussen voor de gebruiker aan het oog onttrokken; de verdeling van de zoekcapaciteit over de ter beschikking staande computers vindt nu automatisch plaats. De gebruiker kan verder nog altijd kiezen tussen een simpele zoekregel, zonder verdere poespas, en een formulier waarin je meer kunt specificeren. Sinds de vorige bespreking is aan de simpele zoekregel niets veranderd, afgezien van een wijziging van de grafische vormgeving - er is geen enge loopspin meer te zien, wel eer regelmatig wisselende advertentie. Het zoekformulier heeft echter al weer twee maal ingrijpende wijzigingen en uitbreidingen ondergaan, overigens zonder de onderliggende zoektechniek te beïnvloeden. Het wordt opgevraagd vanuit het beginscherm door te klikken op 'Search Options' (http:// www.lycos.com/cgi-bin/nph-randurl/cgi-bin/ largehostform i.html). In dat scherm kunnen met pull-down menu's vier keuzes ingesteld worden; twee voor 'Search Options' en twee voor 'Display Options'. Vooral de eerste Search Option is een interessante uitbreiding. Daarbij kun je nu aangeven hoeveel van de als zoekvraag ingetikte termen minimaal in de gevonden documenten moeten voorkomen. Als in de zoekregel een reeks van 5 zoektermen is ingetikt, kun je zo bijvoorbeeld eisen dat in de te vinden documenten tenminste 3 van die termen moeten voorkomen. Binnen een best-match zoekmechanisme zoals dat van Lycos, dat in feite altijd een OR-relatie toepast voordat de relevantiescores berekend en de resultaten in volgorde gezet worden, biedt dat de mogelijkheid om toch een soort globale AND-eis op te leggen. Naast de keuze dat minstens 2, 3, 4, 5, 6 of 7 woorden uit de reeks ingetikte zoektermen moeten voorkomen, kan ook worden aangegeven dat ze allemaal moeten voorkomen (match all terms, dus een volledige AND-relatie) of dat minstens één term moet voorkomen (match any term, dus een OR-relatie). In al deze gevallen blijft de best-match berekening voor bepaling van de relevantie volgorde gewoon uitgevoerd worden. Alleen wordt bij een strengere eis de reeks te tonen documenten eerder afgekapt en daarmee het aantal door de computer te verwerken documenten te voren al ingeperkt. Wat deze laatste uitbreiding nog niet biedt, is de mogelijkheid aan te geven dat één bepaald woord uit de reeks zoektermen beslist moet voorkomen. In de tweede Search Option kun je aangeven of je een loose match, een fair match, een good, een close of zelfs een strong match wih hebben. Dit heeft gedeeltelijk hetzelfde effect als de voorgaande optie, zij het dat nu alleen gekeken wordt naar de door het systeem berekende relevantie-scores van gevonden www-documenten. De manier waarop die globaal berekend worden, is in de vorige bijdrage al beschreven. Deze relevantiegraad kan maximaal de waarde i hebben voor documenten waarin alle ingetikte termen exact zo in het begin van het document voorkomen. De bij deze optie gemaakte keuze bepaalt bij welke waarde van de relevantiegraad de reeks te tonen documenten wordt afgebroken. Daarmee kun je dus al te lange reeksen, aan het eind weinig relevante zoekresultaten voorkomen. Met de Diplay Options kan het per 'pagina' (maximaal) te tonen aantal resultaten ingesteld worden op 10, 20, 30 of 40. Overigens kunnen altijd weer vervolgpagina's opgeroepen worden, zolang er nog meer te tonen valt. Daarnaast kun je summary, standard of detailed presentatie van de zoekresultaten kiezen. Summary geeft maar één regel (met URL en be- LHGIN11995)4 53

Figuren 1-4 Voorbeelden van zoek- en resultaatschermen van Lycos. Zowel het eenvoudige zoekscherm als het uitgebreider zoekformulier worden getoond. In de korte resultaat-presentatie wordt een enkele regel per gevonden document getoond, met alleen aanklikbare titels, hun berekende relevantiegraad en hoeveel van de gevraagde zoektermen erin voorkomen. De uitgebreide presentatie bevat bovendien 'outlines' en abstracts van de gevonden pagina's die tegelijk met het indexeren door de computer gegenereerd zijn. File Edit View Go Bookmarks Qplions Directory Help File Edit View Go Bookrnarks Qptions Directory Help m t t t r «r m C* LUftiS v Hit C SEARUH NEWS THTcÜALOGÖFTHËINTERhfFT 'f HOT LISTS > HELP & REFERENUE C» ADD/DELETE URL C LYCOS INC PQINT REVIEWS C POINT NOW "Lycos is what has rnade the WWW useful to me. I start every search with Lycos." Marvin H.. Albany NY >f E! NET t SEARCH C HELP I REFERENCE C NEWS (, ADD/DELETE URL HOT LISTS LYCOS INC (, POINT REVIEWS (. POINT NOW Lycos indexes 91% ofthe webl Query: html pjc i mer. ~ i n t r oduct^i on. t u t OT) 11 S e arch J S e ar ch Options [ Formless Lycos Search Query: html. primer. intrpducti j*^al Heard the news? Click here to find out. Click on graphic to visit site. Search Options: Display Opt ions Search language hi Formless Interface tch all terms (AND] tch any term (ORJ tch 2 terms tch A terms tch 5 terms tch 6 terms tch 7 terms s u lts 11 File dit View Go Bookmarks Qptions Directory Help \i& Lycos search: html. primer, introduction. tutorial. Lycos Oct 30, 1995 catalog, 10797133 unique URLs This is a searchable index. Enter search keywords' [ (file jedit View Go Bookmarks Oplions Directory k» 3^^Q@g 1) Introduction to Wrïting HTML Documents RanJcing: 1.0000, 3 of 1 teems, adj 0.9 Links to outside Resources: 21 Words matched in page: primer, tutonal Help Found 510461 documents matching at least one search terra Printirig only the first 8 documents with at least scores of O 100 and matching 3 search terms. Found 4 matching words (number of documents): html (51709), primer (11434), introduction (19536), tutorial (17268) 1) Introduction to WritingHTML Documents [1.0000, 3 of 4 terms, adj 0.9] 2) HTML Information Overview and References [O 5345, 3 of 4 terms] 3) HTML Information Overview and References [O 5318, 3 of 4 terms] 4) My Humble Links [0.5279, 3 of 4 terras] 5) HTML Stuff [0.5142, 3 of 4 terms] Outiine: Introduction to Wnting HTML Documents Info on HTML and the Web Examples Some sample headings Other References Abstract: Introduction to Wnting HTML Documents Info on HTML and the Web Tlns document is part of the World Wide "Web. Before attempting to deveiop Web documents you should have a good understanding of what the Web is. There is a nice World Wide Web Primer which contains pointers to lots of reference matenal While this document prviodes an introdution to the HTML authoring language, it does not address the design of Web pages Yale's style manual is an excellent guide to the ediüonal and graphic design of hypermedia documents If you are planning on wnting any HTML documents you should start by reading NCSA'a HTML primer. The Web also allows you to learn by example. Using Mosaic you can look at the ;jr;^al http./avww.ksu edu/"camk/web.html '<^~al http:/awiw.bu e d u/htm I-intro, hlm l rekende relevantiegraad) per gevonden document, standard en detailed geven ook een beperkte weergave van de inhoud zelf. Ook nieuw bij Lycos is tenslotte dat naast de gerichte zoekmogelijkheden, een aantal categorieën met zorgvuldig voorgeselecteerde verwijzingen is opgezet, waarop zonder zoeken direct geklikt kan worden. Daaronder zijn bijvoorbeeld Business, News, Reference and Weather. Op dit verschijnsel, dat we ook bij andere zoekpagina's wel tegenkomen, zal ik in een volgende aflevering wellicht nog terugkomen. Ten slotte is nog een kritische noot op zijn plaats. In de nogal reclame-achtige teksten die Lycos als antwoorden op Frequently Asked Questions op het net gezet heeft, wordt hoog opgegeven over het voortdurend up-to-date houden van de gegevens in de index. Daarbij wordt trots vermeld dat de Lycos-robot wel 50.000 Web-pagina's per dag bezoekt om ze te indexeren, te herindexeren of uit de index te verwijderen. Als dat getal echt klopt, leert een simpele berekening dat met een huidige omvang van 10 miljoen geïndexeerde pagina's, elke pagina hoogstens eens per 200 dagen opnieuw door de robot bezocht wordt. De nochtans getrokken conclusie 'so the Lycos catalog is never outdated mist dan dus elke grond. NlightN De kwaliteiten van het Lycos zoeksysteem blijken nogal wat aandacht getrokken te hebben. Dat blijkt in de eerste plaats uit het feit dat het grote MicroSoft een licentie genomen heeft om de software voor de ontsluiting van zijn MicroSoft-network te gaan gebruiken. Een andere organisatie met een licentie op de Lycos-software is 'The Library Corporation'. Deze 54 LHGINO 995)4

heeft de software (van buitenaf voor de gebruiker niet meer herkenbaar) gebruikt om zijn NlightN systeem op te z:tten. In NlightN worden echter niet alleen www-documenten toegankelijk gemaakt, maar daarnaast ook allerlei aidere databases en informatiesystemen. Het is dan ook een commercieel opgezet systeem, waar de gebruiker voor gevonden informatie moet betalen. Dat is voor het www nog een beetje een nieuwe, maar wel steeds gebruikelijker ontwikkeling. Overigens wil dat nog niet zeggen dat zonder een rekening bij NlightN helemaal niet gezocht zou kunnen worden. De eni^e beperking is dat je zonder betaling niet alle details van de gevonden informatie getoond krijgt, zodat het vaak niet mogelijk is de betreffende documenten - ir elektronische of papieren vorm - echt te lokaliseren. Zonder een rekening te hebben, kan ik uit de praktijk dus toch iets over de werking vertellen. Het pr ncipe van NlightN is dat er een soort superindex gemaakt wordt op allerlei informatiebronnen. Bij het zoeken kan die hele index doorzocht worden, maar wordt vervolgens een per deel-index gespecificeerd zaekresultaat vermeld. Zo kan de gebruiker zelf bepalen uit welke groepen informatiebronnen hij de gegevens ook echt wil zien. Dit zelfde principe wordt overigens ook al enige tijd, zij het nog op veel kleinere schaal, toegepast in het in de vorige tabel al genoemde Utrechtse W$ systeem, waarop ik in een volgende aflevering nog eens hoop terug te komen. Een duidelijk voorbeeld van onafhankelijke parallelle ontwikkelingen. De 'ine ex op alles' of 'Universal Index' van NlightN bevat op dit moment vij f deelindexen voor vijf soorten informatiebronnen, namelijk 'internet', 'databases', 'persberichten', 'desktop reference' en een 'book store'. Het internet-deel van de index is gewoon de Lycos vrww-index, zij het in een wat ander jasje. Het databases-deel bevat een groot aantal databases die professionele informatiespecialisten ook al kennen van hun gewone online host-organisaties. Dat zijn enkele honderden bibliografische zowel als full-text bestanden. Daaronder zijn klassiekers als Medline, Psycinfo, ABi-Inform, Metadex, Life Sciences Collection, Pollution Abstracts, us Patents en Findex, maar ook wat populairder bronnen als Showbiz Today en CNN Newsroom. In het news-deel vinden we persberichten uit ond:r meer Business-wire, Deutsche Presse- Agentu:, Itar-Tass, us Newswire en Inter Press Service. Over de desktop reference en de book store wordt online op dit moment nog geen verdere informatie verstrekt. Als niet-abonnee (je hoort dan nog niet tot de NlightN'dpeople) kun je direct gaan zoeken, maar overal v/aar voor informatie betaald moet worden, kunnen geen verdere (noodzakelijke) details opgevraagd worden. Je kunt je daarnaast voor gratis testgebruik laten registreren. Dan krijg je een budget van 10 NIU te besteden. Die zijn $0,10 per stuk waard; waar NIU de afkorting voor is wordt evenwel niet duidelijk gemaakt. Dit budget kun je alleen gebruiken voor het 'kopen' van informatie die ook in NIU'S geprijsd is. In gewone dollars geprijsde informatie kun je alleen kopen als je echt via creditcard of anderszins een bedrag hebt overgemaakt. Toch kan je ook met die NIU'S al een wat beter idee van de aangeboden informatie krijgen. Bij de standaard (eenvoudige) zoekactie vanuit de NlightN Home-page kan een zoekwoord of een string van zoekwoorden in een zoekregel ingetikt worden. Bij een string wordt dan echt op die woorden in die volgorde, naast elkaar in de tekst gezocht. Het antwoord op de zoekvraag bestaat uit een scherm met de subresultaten (aantallen hits) in elk van de vijf deelindexen. Bij elke categorie die iets oplevert, bevat het scherm een drukknop die het mogelijk maakt die resultaten nader te bekijken. Je krijgt dan een gedetailleerder lijst met resultaten voor die categorie. Hoe het er dan verder uitziet hangt van de gekozen categorie af. Bij de Internet-gegevens moest je aanvankelijk via een 'hotlink'-drukknop $0,10 betalen om aanklikbare URL'S van gevonden web-documenten op het scherm te krijgen. Sinds enige tijd worden, kennelijk uit concurrentieoverwegingen, via 'See'-drukknoppen nu wel gratis aanklikbaar URL'S getoond. Dat gaat meestal via een extra tussenstap waarin achter extra 'See'- drukknoppen telkens meer Web-pagina's zijn samengenomen, waarin de gevraagde zoekterm in eenzelfde documenttitel of in eenzelfde woordstring in de tekst voorkomt. Resultaatlijsten uit de (echte) Databases bevatten rechtstreekse 'Get'-knoppen bij index-ingangen die de zoekterm bevatten en maar één hit opleveren. Indexingangen die meer hits opleveren bevatten 'See'-knoppen waarmee je lijstjes kunt oproepen met de daarbij horende titels en 'Get'-knoppen om die individuele resultaten (één voor één) op te kunnen vragen. Om resultaten achter 'Get'-knoppen te zien te krijgen, moet betaald worden. Voor bedragen van 2 of 3 NIU per hit worden titel, auteurs, tijdschriftnaam en trefwoorden gegeven. Volledige bibliografische gegevens (met jaargang, volume, pagina's e.d.) moeten voor een extra bedrag van meestal $0,10 'gekocht' worden. Eventueel beschikbare abstracts moeten apart betaald worden. Bedragen daarvoor hangen af van de database waaruit het komt. Abstracts uit ABi/Inform kosten bijvoorbeeld $2,00 per stuk. Bij de deelindex met persberichten krijg je gratis al een lijstje met 'headlines'. Met een 'Get'-drukknop krijg je voor i NIU ook de naam van de persdienst en de eerste 2 regels van het bericht te zien. Berichten zelf moeten vervolgens met een 'Buy Citation'-knop LSGIN(I995)4 55

Figuren 5-9 Voorbeelden van zoek- en resultaatschermen van NlightN. Zowel de eenvoudige zoekregel als het uitgebreidere zoekformulier worden getoond. Zoekresultaten worden per deel-index getoond en opvraagbaar gemaakt. Hier is alleen de presentatie van resultaten uit (commerciële) databases afgebeeld. Wanneer informatie niet gratis is, wordt telkens aangegeven hoeveel daarvoor betaald moet worden. File Edit View SP Boofcmarks Options Directory m *o What do you want to know today? You'll find it in. \\ v i G H r /v... a Universe of Databases, News, Internet & more! To Site See, click box, type words, then click "Find" [a1l.ult.tuli M. -B l Help File Edit View fio Bookmarks Qptions Directory Help File Edit View Go_Bookmafks Options Directory <H m & ^'' Gel Help " Ne» Seatch 11 Limk/Fillei "rüvm* Log [ U «er Into T o find what you want to know now: 1. Click on the blank box below. 2. Type any word, words, numbers, or phrase 3 Use boolean operators (& A ) for complex search strings. A For more instrucüons, click the "Get Help" button 5. Click on the "Find" button to begin search. Find llmultatuli l within field ^ i Ge ' He P~l l New Seatch MULTATOLI in the Universal Index: Databases contains 160 authoritative entries from 76 proprietary sources, News contains no occurrences. Internet contains 21 hoüinks from 5,549,000 web sites. Reference contains no occurrences. Book Store contains l titles from 247,000 item inventory. File dit View o Bookmarks Qptions Directory Help File dit View Go Bookmarks Options Directory [^ a fwtl mw \ '(gt Get Help 11 He» Search 11 Review Log 11 Una Into Help yt\ G.IH.ip l N.»5.»aT Here are the 160 occuirences of MULTATULI in the Databases Index: jseejmiiltatiili 118 Namesl [sêêjmultatuk 14 Subjects] l GelJ Multattli [Titte 1972] in LC Books Catalog from Library of Congress for 3 NIUs NlightN fouiid your search term hl this item: Boy ABSTRACT of 88 words for $0.50 Buy CITATION for $0.10 DATABASE: Linguistics and Language Beh SOURCE: Sociological Abstracts, Inc. See Mnltatuli 1820-1887 [3 Namesl Titla How Does One Read Multatuli n? The Pcoble l See imultalui, 1820-1887. [Subject 1987] in British National Bibliography MARC FQe from British Library Name SubjGct(s) Stegeman, Jelle applied linguistics; translation. r?-al Netscape voor $0,10 per stuk gekocht worden. De reference collectie levert een lijst met vindplaatsen uit een grote collectie naslagwerken. Teksten (artikelen of definities) kun je voor bedragen van $0,10 of $1,00 kopen. In de book store, tenslotte, is de informatie gratis. Die is echter vooral bedoeld om meteen boeken te kunnen bestellen (gewoon de papieren folio-produkten), waarvoor dan (uiteraard) ook betaald moet worden. Geregistreerde gebruikers (ook de gratis test-gebruikers) komen in een zoekformulier met wat uitgebreider mogelijkheden. Ook anderen kunnen daar vanuit de NlightN Home page komen door te kiezen voor Site (niet Sight!) Seeing. In dat zoekformulier kun je in de zoekregel rechtstreeks Booleaanse combinaties intikken (met & voor AND, l voor OR en A voor NOT). Naast de zoekregel is verder een venstertje waarin je kunt aanklikken of het hele 'Universe' (dus alle vijf deelindexen) doorzocht moet worden of dat direct één daarvan gekozen wordt. Een derde venstertje biedt de wat kryptische keuze tussen ' within field, 'alphabetically en 'across fields. Dat eerste blijkt te betekenen dat direct op de exacte zoektermen (in alle velden) gezocht wordt. Bij de tweede mogelijkheid wordt ook gezocht op termen die in de index 'alfabetisch' op de ingetikte zoekterm volgen, waarbij je net zo lang door de resultaten (per term) verder kunt bladeren als je wilt. Over de betekenis van de (nieuwe) derde mogelijkheid hult het NlightN hulpscherm zich helaas in stilzwijgen. De praktijk leert dat het (aanzienlijk) minder oplevert. 56 LHGINO 995)4

Voor wat betreft de www-informatie biedt NlightN dus absoluut niet meer dan wat ook al (gratis) met Lycos gevonden kan worden, en dan bovendien nog veel omslachtiger. De interessante ontwikkeling is echter de integratie met andere informatiebronnen. Gebru: kers kunnen zo makkelijk aan enige informatie komen, over welk ondej-werp dan ook, waarbij natuurlijk vooral op de eindgebruiker gemikt wordt. Ik zeg hier heel bewust 'enige', want ook voor die eindgebruiker zal het lang niet altijd helder zijn hoe hij echt er. (vooral) volledig aan gewenste informatie moet komen. Die zal zich namelijk nauwelijks bewust zijn va:i hetgeen zo gemist wordt, bijvoorbeeld doordat niet de juiste zoektermen gebruikt worden. Op zijn beurt zal de echte informatiespecialist al snel alle veifijnde zoekmogelijkheden missen, die gewone online hosts bieden, met veld-specifiek zoeken, online thesauri, limitering, zoom of rank-commando's en wat al niet meer. Dat is namelijk allemaal ingeleverd om het voor de eindgebruiker maar 'makkelijk' te maken. Voordat je eindelijk een redelijk aantal artikelen opgevriagd of bekeken hebt, moet bovendien een enorm aantal keren op knoppen 'geklikt' worden, voor elk afzonderlijk artikel opnieuw, en moet evenzovele keren op het opsturen van een volgend scherm gewacht worden. Vooral daardoor zal een wat diepgn.vender NlightN zoekactie heel wat langer duren dan een zoekactie bij een klassieke host. Op dit moment blijkt NlightN nog sterk in ontwikkeling :e zijn. Dat is natuurlijk prima, maar het is wel wat verwarrend dat elke paar weken weer deels andere mogeli kheden en bronnen aangeboden worden. Bovendien houdt de online uitleg daar absoluut geen gelijke tred mee. Hoewel deze tekst over NlightN al weer enkele keren aan de actuele situatie is aangepast, dient de geïnteresseerde lezer dus zelf nog goed te kijken hoi; het systeem er op dat moment weer uitziet. Zoeken met de WWW Worm De www Worm (ook wel wwww) is één van de klassieke zoekmachines op www. Dit keer geen hardlopende J pin (Lycos) die achter de informatie aan gaat, maar een kronkelende worm die zich langzaam maar gestaag door de rijstebrijberg van het www heen eet en alle gegevens die hij daarbij tegenkomt in zijn darmkanaal verteert tot voor ons doorzoekbare brokken. (Tot wat een melige beeldspraak inspireren al die metaforen uit de Internetwereld toch). Volgens de verschafte gegevens waren juni 1995 gegevens van ongeveer ;i.ooo.ooo www-pagina's doorzoekbaar, gegevens die begin november nog niet gewijzigd waren. Daarbij beperkt men zich overigens tot alleen die www-c ocumenten waarheen via een hyperlink vanuit andere documenten verwezen wordt. Ook gezien de hierna te bespreken zoekmogelijkheden, zou je de www Worm daarom een soort van citatie-index kunnen noemen. Verder is van al die pagina's maar een heel beperkt deel van de tekst geïndexeerd. Aanvankelijk bood de Worm weinig gebruikersvriendelijke zoekmogelijkheden, maar daar is nu iets aan gedaan. Zelfs wordt nu een aantal verschillende mogelijkheden geboden. In het beginscherm dat je middels het in de tabel gegeven URL te zien krijgt, kom je in een 'snel'-zoekmogelijkheid terecht, met een aanklikbare keuze tussen zoeken met AND of met OR. Dat houdt in dat tussen de woorden die - gewoon achter elkaar - in de zoekregel ingevuld worden, hetzij een AND-, hetzij een OR-relatie gelegd wordt; een combinatie van die twee in één zoekopdracht is dus niet mogelijk. Zonder dat dat expliciet gezegd wordt, blijkt dat de ingetikte woorden automatisch links én rechts worden getrunceerd. RECHT levert dus ook UTRECHT. Verder kan in een rolluikje aangegeven worden of maximaal i, 5, 50, 500 of 5000 (!) documenten van het zoekresultaat getoond moeten worden. Daarnaast zijn langzamer maar flexibeler zoekacties mogelijk met gebruik van zogenaamde 'reguliere expressies', waarvoor de in veel UNix-systemen standaard aanwezige utility EGREP gebruikt wordt. In je zoekterm kun je daarmee onder meer reeksen tekens met variabele gegevens maar met vaste patronen weergeven. Voor informatici schijnt het werken hiermee gesneden koek te zijn, maar voor argeloze andere gebruikers is dit een zoektaaltje dat eerst nog wel enige oefening vergt. Deze zoekmogelijkheid kom je overigens alleen nog tegen in een vervolgscherm 'wwwwintro.html' waarin een (oude) introductie van het systeem en een aantal illustratieve voorbeelden gegeven worden. Verder laat de Worm je kiezen in welke onderdelen van www-documenten je wilt zoeken. Die mogelijkheid is er omdat ook www-documenten een soort rudimentaire velden-structuur hebben. Deze structuur is in HTML (de in www gebruikte HyperText Mark-up Language) standaard voorgeschreven en gemarkeerd met vaste HTML begin- en eind-codes. Zo kent elk www-document een titel (begincode <title>, eindcode </title>) die geen onderdeel uitmaakt van de op het scherm te tonen document-tekst zelf. Wel verschijnt die titel bij gebruik van Netscape in de blauwe vensterbalk bovenaan het scherm. Daarnaast is er een, overigens niet verplichte, opdeling van het document zelf in 'head' (<head>) en 'body' (<body>}. In de praktijk worden de <head>-codes meestal genest rondom of binnen het <title>-dee\ gezet, zodat die kop evenmin in de document-tekst zelf terecht komt. De <body> is dan de rest van het document. Daarin kunnen eventueel nog speciale elementen aan hun HTML-codes herkend worden. Zo is er een aantal ni- LSGIN( 1995)4 57

veaus van hoofdstuk en paragraaf-titels, zogenaamde 'headings' die met <hi> tot en met <h6> worden aangegeven. Verder zijn uiteraard ook de hyperlinks naar andere documenten te herkennen aan codes in de brontekst. Het adres (URL) waarheen gelinkt wordt, maakt onderdeel van die code zelf uit; tussen de begin- en eindcode van een hyperlink staat het stukje tekst in het document dat op het scherm als link oplicht. Bij gebruik van Mosaic of Netscape wordt die link-tekst in blauw weergegeven. Daarnaast heeft elk www-document natuurlijk ook nog zelf een URL waarop het teruggezocht zou kunnen worden. Van enkele van deze onderdelen kan bij het zoeken met de www Worm gebruik gemaakt worden. Daartoe biedt de Worm een viertal keuzes. Zo kun je kiezen voor: 'Search only in document titles'. Daarmee zoek je alleen in de (tekst van) de titels van de wwwdocumenten. Alle overige tekst (de 'body') wordt dus niet doorzocht, ook niet eventueel daarin voorkomende hoofdstuk- en paragraaf-koppen. Een andere mogelijkheid is te zoeken op de adressen, de URL'S van te vinden documenten of op onderdelen daarvan. Dit wordt aangegeven met 'Search only in document addresses'. Aangezien alle punten en slashes daarin door de Worm als woordscheiders worden beschouwd, kan op deze manier makkelijk naar een www-document gezocht worden waarvan bijvoorbeeld wel de filenaam, maar niet het computer-adres bekend is. Via AND-combinaties biedt dit allerlei mogelijkheden. Een beperking waar je dan wel tegenaan loopt, is dat alleen woorden van minimaal drie letters geïndexeerd worden, zodat je met de standaard zoekmogelijkheid bijvoorbeeld niet op de tweeletterige landencodes uit Internet-adressen kunt zoeken. Echte experts zullen daarom graag van de al genoemde reguliere expressies gebruik maken, waarbij dit wel kan. Bij beide zoekmogelijkheden is het resultaat een lijst van pagina-titels waaruit een gewenste direct aangeklikt kan worden. De overige twee keuzes maken het mogelijk specifiek te zoeken in de hyperlinks die in de documenten voorkomen. Met 'Search all URL references' wordt gezocht in de teksten die in hyperlinks gebruikt worden, dus in de op het scherm blauw oplichtende woorden. De gedachte hierachter is dat de hyperlink verwijzingen in een tekst meer over de inhoud van die tekst zeggen dan zo maar willekeurige woorden daaruit. Dat si dus en soortgelijke filosofie als die achter de klassieke citatie-indexen. Het citatie-indexachtige aspect van de Worm manifesteert zich ook door het feit dat het zoekresultaat uit verwijzingen naar paren documenten bestaat, telkens zowel het document van waaruit gelinkt wordt als dat waarheen gelinkt wordt; dus als het ware het citerende en het geciteerde document samen. 'Search all URL adresses' tenslotte biedt de mogelijkheid om op dezelfde wijze te zoeken via de URL'S die in de hyperlinks gebruikt worden. Net als eerder bij het directe zoeken, moet je dan dus op zijn minst al een gedeelte van een interessant URL kennen. Overigens bleken zoekresultaten bij deze beide laatste manieren van zoeken ontzettend veel (verwijzingen naar) plaatjes te bevatten. Vermoedelijk komt dat doordat alle links naar plaatjes (die in een grafische browser als Netscape meteen al in de tekst worden afgebeeld, maar in feite gelinkt zijn) ook als echte hyperlinks meegeïndexeerd worden. En in www zijn er natuurlijk steeds meer documenten die miegelen van zulke plaatjes, iconen, speciale grafische balkjes, portretten enzovoort. In de praktijk komen er daardoor soms maar weinig 'gewone' links naar tekstdocumenten in je zoekresultaten voor. In die zoekresultaten wordt van de citerende docu- Figuren 10-11 Voorbeelden van schermen van de WWW Worm. Bij het zoeken in hyperlink-teksten uit WWW-pagina's ('URL references' als zoekveld), bevat het zoekresultaat aanklikbare links naar telkens zowel het verwijzende document als dat waarheen verwezen wordt. File Edit View Go Bookmarks Options Directory Help File Edit View Go Bookmarks Qptions Directory hielp ^H» MSMI l hf.r.1 r.r.tr.ar i WWWW - WORLD WIDE WEB WORM l^-a Best of the Web '94 - Best Navisaflonal Ald. Oliver McBryan Serving J, 000, 000 URL's to 2,000,000 folks/month. Insrructions, Definitions, Examples, Failures, Register, WWWW Paper. - Return to Searchina Actual keywords used: html and primer Search took 4.62 secs of CPU time and 23.02 secs of elapsed time T VOTELINK -- Check out this week's *hot* issues and VOTE. 1. Searcti all URL references i 1 b. OH - match any keyword J 5 matches» Keywords: html primer start Search J OUT Server Is experiencing diflliulries today. ^ ta] 1. ncsa's html primer cit&sin: http://mcmuse.mc.maricopa.edu/ 2. http://www.ncsa.uiuc. edu/demoweb/hanl-primer.html. i 3. ETTML Primer -J- cited in: http://docserver.bnl.aov/com/www/default.hhnl '~ rt*a\ http /Awiw ncsa urne edu/generel/lnterne1/vvvvw/htmlprimer. html 58 LHGINd 995)4

menten alleen het URL (direct aanklikbaar) in de lijst met zoekresultaten vermeld. Als het geciteerde document een echt tekst-document is, wordt dat (ook direct aanklikbaar) in de.ijst gerepresenteerd door de linktekst. Als een plaatje of icoontje deel uitmaakt van de linktekst, wordt dat daar ook bij getoond (ook al is het - r et als de linktekst zelf- in feite uit het citerende document afkomstig). Bij verwijzing naar niet-html files (plaatjes, geluid e.d.) is het niet altijd duidelijk wat er in de lijst gezet wordt, soms schijnt dat het laatste stukje van het geciteerde URL - d.w.z. de filenaam - te zijn, soms ook teksten die meer op document-:itels of link-teksten lijken. In de i n een introductie-tekst gegeven uitleg van het systeem worden voor de vier hier genoemde zoekmogelijkheden helaas nog de oude benamingen gebruikt, respectievelijk: 'Search only in titles of citing documents', 'Search only in names of citing documents', 'Search all citation hypertext' en 'Search all naries of cited URL'S'. Ook verder bleek deze hulptekst r og niet overal aan het huidige zoekscherm aangepast te zijn. In de zoekpraktijk blijkt de Worm redelijk te werken. Toch zal in veel praktijkgevallen het zoeken op alleen document-titels een te sterke beperking zijn. Vaak vindt je niets of krijg je door de automatische truncatie alleen maar ongewenste resultaten. De mogelijkheid specifiek op hyperlinks te zoeken is een aardige aanvulling, zij het ook maar met beperkte toepassing. Mijn standaard zoekvraag naar Multatuli of Max Havelaar (die in Lycos aardig wat opleverde) gaf hier in beide gevallen een nul-resultaat. Een argeloze (eind-) gebruiker zal dan al snel de onterechte conclusie trekken dat er dus niets over dat onderwerp in www te vinden is. Kennis van wat de zoekmachine precies doet en waarin hij eigenlijk zoekt, alsmede vergelijkingsmateriaal met andere zoekmachines zijn voor een goed zoekresultaat dus onontbeerlijk. i. Aanvankelijk bleek Lady Chatterley's Lover (http://www.datatext. co.uk/library/dhl/chat/chapters.htm) overigens helemaal niet geïndexeerd te zijn, hoewel dat met Robinson Crusoe en andere op dezelfde DataText-server aangeboden klassieken uit de wereldliteratuur wel het geval was. Mijn achterdocht dat dit de kop opstekend Amerikaans puritanisme was, bleek gelukkig ongegrond, want intussen zijn ook alle hoofdstukken van Lady Chatterley (op termen uit het begin van die hoofdstukken) in Lycos terug te vinden. Retrieval-systemen voor World-Wide-Web informatie naam AliWeb CUIVV3 Cagalog EINet Ga axy Ha 'vest InfoSeek * JunpStation H,:** LYCOS NIKOS ** NlightN * OpenText Web Index RBSE WE. (Zoeken op Internet) WebCrawler WWW Worm Yahoo Sedrch aanbieder Nexor Uriversité Geneve E l Net/M C C Colorado University InfoSeek Corporation (Cal.) Stirling University (Scotland) Carnegie Mellon University Rockwell Network Systems /California Polytechnic The Library Corporation Open Text Corporation / ULInet (Can.) NASA Universiteit Utrecht University of Washington (Seattle) University of Colorado Stanford University URL http://web.nexor.co.uk/public/aliweb/search/ doc/f orm. html http://cuiwww.unige.ch/w3catalog http://galaxy.einet.net/search.html http://harvest.cs.colorado.edu/ http://www.infoseek.com:80/home http://js.stir.ac.uk/jsbin/jsii http://lycos.cs.cmu.com/ http://www.rns.com/cgi-bin/nikos http://www.rns.com/cgi-bin/nomad http://www.nlightn.com/ http://www.opentext.com/ http://rbse.jsc.nasa.gov/eichmann/urlsearch. html http://pablo.ubu.ruu.nl/ned/lnternet.html http://pablo.ubu.ruu.nl/ned/zoeken.html http://www.webcrawler.com/webcrawler/ WebQuery.html http://www.cs.colorado.edu/home/mcbryan/ WWWW.html http://www.yahoo.com/search.html * voor volledige zoekmogelijkheden moet een rekening geopend worden ** vroegere naam 'WWW Nomad'; ook wel bekend als 'Zorbamatic' *** wordt eind december 1995 beëindigd USGINO 995)4 59