HierTag: een hiërarchisch en taggebaseerd bestandssysteem. Ontwerp en implementatie.

Maat: px
Weergave met pagina beginnen:

Download "HierTag: een hiërarchisch en taggebaseerd bestandssysteem. Ontwerp en implementatie."

Transcriptie

1 HierTag: een hiërarchisch en taggebaseerd bestandssysteem. Ontwerp en implementatie. Auteur: Karel Marissens Promotor: Philippe Van Laethem Studierichting: Toegepaste Informatica Afstudeerrichting Netwerken Academiejaar:

2

3 HierTag: een hiërarchisch en taggebaseerd bestandssysteem. Ontwerp en implementatie. Auteur: Karel Marissens Promotor: Philippe Van Laethem Studierichting: Toegepaste Informatica Afstudeerrichting Netwerken Academiejaar:

4 Synopsis De laatste jaren neemt de hoeveelheid bestanden en informatie die een computergebruiker bijhoudt steeds meer toe. Deze bestanden worden gesorteerd in een hiërarchie, een boomstructuur. Elk bestand krijgt hierbinnen een vaste plaats. Een hiërarchisch bestandssysteem zorgt voor deze opslag. Hoe meer data erbij komen, hoe moeilijker het wordt deze terug te vinden. Daarom wordt er op zoek gegaan naar andere methodes voor het organiseren van informatie. Met de opkomst van Web 2.0 is het taggen van data populairder geworden. Tags, beschrijvende kernwoorden, worden geassocieerd met data. Achteraf kunnen de data teruggevonden worden door te zoeken op basis van deze tags. Eén van de eerste websites die dit idee succesvol toepaste is Delicious (www.del.icio.us), een 'social bookmarking' website waarbij bladwijzers online kunnen bijgehouden worden. Deze worden niet gesorteerd in mappen, maar worden getagd. Door tags te combineren kan gezocht worden naar bladwijzers. Andere bekende websites die het concept van tagging gebruiken zijn Flickr (www.flickr.com), een website voor het online plaatsen van foto's, YouTube (www.youtube.com), Last.fm (www.last.fm) en Gmail (www.gmail.com). Zou dit idee uitgebreid kunnen worden naar een systeem voor het beheer van alle bestanden op een computer? Bij onderzoek bleken al een aantal taggebaseerde bestandssystemen te bestaan. Voorbeelden hiervan zijn DBFS en Tagsistant. Er bleken echter ook een aantal nadelen verbonden te zijn aan dergelijke bestandssystemen. Bestanden hebben geen vaste plaats meer maar kunnen teruggevonden worden door het combineren van tags. De gebruiker moet dus altijd zoeken naar de bestanden. Mensen hebben echter graag vaste logische structuren. Het overzicht over de bestanden vervalt bij een taggebaseerd bestandssysteem. Hierdoor ontstond het idee om een hiërarchisch en taggebaseerd bestandssysteem te combineren. Ook dit soort bestandssystemen bestond reeds. Voorbeelden hiervan zijn Stratus, XTagFS en Leap. Deze systemen werken echter naast de bestaande hiërarchie. Leap bijvoorbeeld is een applicatie waarbinnen bestanden getagd kunnen worden. De tagfunctionaliteit is echter enkel beschikbaar binnen de applicatie zelf. Deze is volledig afwezig in bijvoorbeeld dialoogvensters voor het openen en opslaan van bestanden. Het ontbrak de bestaande oplossingen dus aan een zekere mate van integratie met de hiërarchie. Dit probeert HierTag op te lossen. HierTag behoudt de hiërarchie maar voegt in elke map enkele speciale submappen toe waarmee aan bestanden tags kunnen toegekend worden of terug verwijderd worden en waarmee gezocht kan worden op basis van tags naar bestanden in de map van waaruit de zoekmap geopend wordt. Binnen deze zoekopdracht kunnen tags gecombineerd worden met de operatoren and, or en combine_with. Heel dit systeem is geïmplementeerd als een hiërarchie. Tags en operatoren worden voorgesteld als mappen. Zoeken op basis van tags komt dus overeen met het achtereenvolgens openen van mappen. Aangezien HierTag werkt via een hiërarchie werkt het samen met om het even welke bestandsbeheer-applicatie en is het ook beschikbaar in dialoogvensters voor het openen en opslaan van bestanden. HierTag is geschreven in Python en gebruikt een Xapian database voor het opslaan van de relaties tussen bestanden en tags. Voor de implementatie van het bestandssysteem zelf werd FUSE gebruikt. 2

5 Voorwoord Graag wil ik alle mensen bedanken die mij geholpen hebben gedurende het verloop van mijn bachelorproef. Hiertoe behoren onder andere mijn promotor dhr. Philippe Van Laethem en verscheidene leden van de FUSE en Xapian mailinglijst. 3

6 Inhoudsopgave Inleiding Wat is een bestandssysteem? Soorten bestandssystemen Hiërarchische bestandssystemen Nadelen Voorbeelden Taggebaseerde bestandssystemen Nadelen Voorbeelden Combinaties van hiërarchische en taggebaseerde bestandssystemen Nadelen Voorbeelden HierTag: integratie van een hiërarchisch en taggebaseerd bestandssysteem Hiërarchie Tags toevoegen Tags verwijderen Tags hernoemen Zoeken op basis van tags Resultaatbestanden weergeven Tagselecties opstellen Up to date houden van de bestandslijst Eenvoudige back-ups Installatie van HierTag Technische aanpak Programmeertaal: Python Bestandssysteem: FUSE FUSE API Python bindings Database RDBMS Xapian Beperkingen Caching door bestandsbeheer-applicaties Tags verdwijnen na aanpassing bestand door sommige applicaties Resultaatbestanden aanpassen lukt niet met bepaalde applicaties Opgeloste problemen Een map verwijderen resulteerde in een oneindige lus Een nieuwe speciale map: +TRASH Een verborgen.+rmdir map De speciale mappen verbergen De toevoeging van +SAVE in de +ADD-map Toevoegen van tags aan HierTag via de gebruikersinterface Toekomstmogelijkheden

7 7.1 Mac OS X versie Eigen mapnamen voor speciale mappen Tagsuggesties Negaties in tagselecties Tags met bepaalde functionaliteit Totaalaantallen Uitbreiding gebruikersinterface Besluit Literatuurlijst

8 Inleiding Het associëren van tags, beschrijvende kernwoorden, met data is de laatste jaren enorm opgekomen, vooral door de opkomst van Web 2.0. Delicious (www.del.icio.us), een website waarbij bladwijzers online kunnen bijgehouden worden, was één van de eerste die het idee succesvol toepaste. Bladwijzers werden getagd, zodat deze teruggevonden konden worden door te zoeken op basis van tags. Een ander bekend voorbeeld is Flickr (www.flickr.com). Deze website biedt gebruikers de mogelijkheid eenvoudig foto s online te plaatsen en deze te taggen. Achteraf kunnen foto s teruggevonden worden door te zoeken op tags. Het idee is verder doorgedrongen bij websites zoals YouTube (www.youtube.com), Last.fm (www.last.fm) en Gmail (www.gmail.com). Ook offline applicaties zoals iphoto, voor het beheer van foto s, beschikken nu over tagfunctionaliteit. Deze evolutie, een zoektocht naar nieuwe manieren om informatie te organiseren, heeft mij altijd al gefascineerd. Toen ik het voorstel voor het maken van een taggebaseerd bestandssysteem tussen de voorstellen voor bachelorproeven zag staan, was mijn interesse meteen gewekt. Een taggebaseerd bestandssysteem zou het idee van tagging kunnen doortrekken van specifieke datatypes (bladwijzers, muziek, foto s) naar alle bestanden op de computer van een eindgebruiker. Alvorens een dergelijk bestandssysteem kon ontwikkeld worden was het belangrijk om eerst onderzoek te doen naar wat een bestandssysteem precies is. Dit wordt uitgelegd in het eerste hoofdstuk. Ook belangrijk was welke types bestandssystemen er reeds bestaan en wat hun vooren nadelen zijn. Hier wordt uitgebreid op ingegaan in het tweede hoofdstuk. Op basis van die kennis kon een ontwerp voor een nieuw bestandssysteem ontwikkeld worden. In het derde hoofdstuk wordt dieper ingegaan op de werking van dit nieuwe bestandssysteem, met de naam HierTag. Hoe dit technisch werd verwezenlijkt wordt uit de doeken gedaan in hoofdstuk vier. Hoofdstuk vijf handelt over de beperkingen tijdens het gebruik van HierTag die buiten HierTag zelf liggen. De problemen die tijdens de ontwikkeling werden opgelost zijn vermeld in hoofdstuk zes. In een laatste hoofdstuk wordt ten slotte ingegaan op wat de toekomst zou kunnen brengen voor HierTag. 6

9 1 Wat is een bestandssysteem? Een bestandssysteem voorziet een methode voor het opslaan en organiseren van computerbestanden (documenten, s, foto s, filmpjes, liedjes,...) en de data die ze bevatten zodat deze gemakkelijk terug te vinden zijn en geopend kunnen worden. Sommige bestandssystemen gebruiken opslagmedia zoals een harde schijf of cd-rom en houden de fysieke locatie van de bestanden bij. Andere bestandssystemen geven toegang tot data op servers door zich te gedragen als clients voor een netwerk protocol (bv. NFS en SMB clients). Daarnaast zijn er ook virtuele bestandssystemen. Deze bieden een toegangsmethode voor virtuele data. Een typisch voorbeeld hiervan is procfs ( process filesystem ), waarmee procesinformatie van de kernel geraadpleegd kan worden op vele Unix-achtige computersystemen. 7

10 2 Soorten bestandssystemen 2.1 Hiërarchische bestandssystemen Een hiërarchisch bestandssysteem organiseert bestanden in een boomstructuur van mappen. In de root, het vertrekpunt van het bestandssysteem, kunnen verschillende mappen en bestanden aanwezig zijn. Elke map in het bestandssysteem kan op zijn beurt weer andere mappen en bestanden bevatten. Op dit moment is dit het meest gebruikte systeem. De manier van werken komt bij mensen zeer logisch over omdat het overeenkomt met de manier waarop fysieke documenten gesorteerd worden. Fysieke documenten worden typisch gegroepeerd in mapjes. Deze mapjes worden gegroepeerd in laden, die op hun beurt gegroepeerd worden in een kast. Op diezelfde manier kunnen bestanden in een hiërarchisch bestandssysteem gegroepeerd worden in mappen, kunnen mappen gegroepeerd worden in nog andere mappen, enz. Op figuur 2.1 is een eenvoudig voorbeeld te zien van een hiërarchie. In de root, aangeduid met /, zijn 2 mappen aanwezig: Foto s en Iconen. In beide mappen zitten enkele bestanden. Figuur 2.1: Een hiërarchie. De unieke locatie van een map of bestand binnen een bestandssysteem wordt typisch aangegeven door middel van een pad. Dit is een opeenvolging van hoe de mappenstructuur doorlopen moet worden om vanuit de root bij een bepaalde map of bestand te komen. De namen van de mappen en bestanden worden hierbij gescheiden door een /. Er kan bijvoorbeeld verwezen worden naar de map Iconen in het bovenstaande schema met het pad /Iconen. Om naar de afbeelding van het legoblokje te verwijzen wordt het pad /Iconen/Legoblok.png gebruikt. Dit wijst erop dat om bij het bestand Legoblok.png te komen een gebruiker eerst de map Iconen moet openen gevolgd door het bestand Legoblok.png. Dit principe kan doorgetrokken worden naar uitgebreidere hiërarchieën, waarbij bijvoorbeeld verwijst naar een foto van de Tower Bridge in Londen die genomen is op de eerste dag van een reis naar Londen in het jaar Om het bestand terug te vinden opent de gebruiker vanuit de root de map Foto s. Vervolgens selecteert hij de map 2009, gevolgd door de map Londen en de map Dag1. Hierin vindt hij uiteindelijk het bestand Towerbridge.jpg terug. /Foto s/2009/londen/dag1/towerbridge.jpg 8

11 2.1.1 Nadelen Het principe van een hiërarchisch bestandssysteem is logisch en eenvoudig. Doordat een bestand een vaste plaats heeft in de hiërarchie is het echter niet altijd even eenvoudig om een bestand terug te vinden. Immers, het precieze pad naar het bestand moet bekend zijn. Weet de gebruiker in het voorbeeld van de Tower Bridge niet meer in welk jaar hij naar Londen geweest is, dan moet hij mogelijk verschillende mappen, die verschillende jaren voorstellen, afgaan om de foto terug te vinden. Zo kunnen ook problemen optreden wanneer een gebruiker bijvoorbeeld foto s en filmpjes heeft van een trouwfeest. De foto s kunnen in een submap van de map Foto s geplaatst worden (/Foto s/trouwfeest) en de filmpjes in een submap van de map Filmpjes (/Filmpjes/Trouwfeest). Echter raakt daardoor het verband tussen beide verloren. Een gebruiker kan bij het zien van de foto s van het trouwfeest niet weten dat er ook filmpjes aanwezig zijn in een andere map. Vele besturingssystemen hebben tegenwoordig een ingebouwde zoekmachine voor bestanden. OS X heeft zo bijvoorbeeld Spotlight, Linux heeft Tracker en Beagle en ook Windows Vista heeft een eigen variant. Deze indexeren alle bestanden, slaan metadata (data die gegevens beschrijven, zoals de auteur van een document, het aantal pagina s, de taal waarin het document is opgesteld,...) op en houden veranderingen in het bestandssysteem bij. Daardoor kan snel gezocht worden naar bestanden. Dit lost het eerste probleem op, waarbij het precieze pad van een bestand gekend moet zijn. Het tweede probleem is echter niet opgelost Voorbeelden Enkele voorbeelden van veelgebruikte hiërarchische bestandssystemen zijn NTFS (Windows), HFS+ (OS X) en EXT3 (Linux). Aan de gebruikerskant lijken deze systemen erg op elkaar. Onder de kap zijn er echter grote verschillen die niet thuishoren binnen de scope van dit verslag. 2.2 Taggebaseerde bestandssystemen Een taggebaseerd bestandssysteem maakt komaf met de boomstructuur van een hiërarchisch bestandssysteem. Bestanden hebben geen vaste plaats meer. In de plaats daarvan worden bestanden getagd. Dit wil zeggen dat beschrijvende kernwoorden, tags, met bestanden geassocieerd worden. Op figuur 2.2 zijn dezelfde bestanden te zien die gebruikt werden bij de uitleg over hiërarchische bestandssystemen. Per bestand zijn een aantal tags aangegeven die omschrijven wat de inhoud van het bestand is, wat voor type bestand het is (foto of icoon) en in welk formaat het bestand opgeslagen is (jpg, gif of png). Figuur 2.2: Tags geassocieerd met bestanden. 9

12 Om bestanden terug te vinden combineert de gebruiker tags in een tagselectie. Hij kan bijvoorbeeld alle bestanden opvragen die getagd zijn als icoon, wat de 4 rechtse afbeeldingen zijn. Een diepere selectie is het opvragen van bestanden die getagd zijn als zowel icoon als basketbal. Dit levert enkel het icoon van de basketbal op. Binnen een tagselectie zijn verschillende combinatiemethoden mogelijk voor het combineren van tags door het gebruik van operatoren. De operatoren die gebruikt kunnen worden verschillen van systeem tot systeem. Enkele voorbeelden hiervan zijn: o o o AND-operator: Enkel bestanden die getagd zijn met beide tags. OR-operator: Bestanden die getagd zijn met één van beide tags, of allebei. NOT-operator: Bestanden die niet getagd zijn met een bepaalde tag. Wanneer meerdere van deze operaties gebruikt kunnen worden binnen een systeem is de vraag welke operaties voorrang krijgen op andere. Hier volgt een voorbeeld waarbij zo n twijfel mogelijk is: icoon AND bal OR lego Het is niet duidelijk wat hiermee bedoeld wordt. Een eerste mogelijkheid is dat de bestanden bedoeld worden die getagd zijn als bal of lego, maar ook als icoon: icoon AND ( bal OR lego ) Een andere mogelijkheid is dat de bestanden bedoeld worden die ofwel getagd zijn als icoon en bal, ofwel als lego: ( icoon AND bal ) OR lego Welke van deze 2 mogelijkheden de juiste is hangt af van het gebruikte systeem Nadelen Doordat bestanden geen vaste plaats meer hebben moet de gebruiker altijd zoeken door middel van tags. Hoewel het mogelijk is om de bestanden terug te vinden is dit voor gebruikers niet altijd een even intuïtieve handeling. Mensen hebben graag een vaste structuur en overzicht over hun bestanden. Dit valt bij taggebaseerde bestandssystemen helemaal weg. Een ander nadeel is dat steeds gezocht wordt in alle bestanden, daar waar het bij zoekmachines voor hiërarchische bestandssystemen vaak mogelijk is de zoekopdracht te beperken tot een bepaalde map in de hiërarchie, waardoor een groot aantal niet-relevante bestanden meteen weg worden gefilterd. Bij taggebaseerde bestandssystemen hebben bestanden bovendien geen relatieve plaats meer ten opzichte van elkaar. Deze relatieve plaats is de manier waarop genavigeerd kan worden van de map waarin het ene bestand zich bevindt naar de map waarin het andere bestand zich bevindt. Een typisch voorbeeld waarbij dit gebruikt wordt is een website. In een hiërarchie staat deze bijvoorbeeld opgeslagen in de map /Website. Binnen deze map is een bestand index.html opgeslagen waar de inhoud van de homepagina instaat: /Website/index.html. Ook is er een submap Afbeeldingen met daarin het bestand foto.jpg: /Website/Afbeeldingen/foto.jpg. In het bestand index.html kan relatief verwezen worden naar de foto als volgt: Afbeeldingen/foto.jpg. Het bestand index.html staat in de map /Website, om vanuit deze map naar de foto te navigeren moet de map Afbeeldingen geopend worden en kan vervolgens de foto teruggevonden worden. Dit is omschreven door het relatieve pad. Merk op dat er geen / voor het relatieve pad staat. Een pad dat begint met een / duidt namelijk op een pad dat omschreven wordt vanuit de root, een zogenaamd absoluut pad, terwijl bij een relatief pad het pad beschreven wordt vanuit een andere map. 10

13 Stel dat het index.html bestand en foto.jpg bestand in een taggebaseerd bestandssysteem zijn opgeslagen. Beide zouden vindbaar zijn, maar foto.jpg zou niet langer in de submap Afbeeldingen staan. De relatieve verwijzing is dus niet langer correct Voorbeelden Er bestaat al een aantal taggebaseerde bestandssystemen, waarvan enkele hier worden opgesomd. Dit zijn allemaal virtuele bestandssystemen in die zin dat ze een laag vormen bovenop een hiërarchisch bestandssysteem DBFS DBFS staat voor Database File System. Het is een proof of concept bestandssysteem geïntegreerd in de core van KDE, één van de bekendste window managers voor Linux. Het vervangt alle dialoogvensters die te maken hebben met het openen en opslaan van bestanden. Een aparte applicatie voor bestandsbeheer (KDBFS) is ook toegevoegd. KDBFS beschikt over een View, waarin de bestanden te zien zijn die aan de selectie voldoen. Deze selectie kan gemaakt worden aan de hand van 5 filters die te zien zijn op figuur 2.3. Deze filteren op basiscategorieën (filter 1), vroeger gemaakte selecties (filter 2), tags (filter 3), datums (filter 4) en bestandsnaam (filter 5). De tagfilter is hierbij het meest relevant. Zoals op de figuur te zien is, is dit meer dan een lange lijst van tags. Tags kunnen hiërarchische relaties hebben. Op de figuur zijn de tags Final Project, SOAT en Stage bijvoorbeeld hiërarchisch binnen de tag University geplaatst. Dit betekent dat wanneer University bij een selectie gebruikt wordt, deze 3 subtags automatisch meegenomen worden in de selectie. Tijdens een filteropdracht kunnen meerdere tags geselecteerd worden. Deze worden in de filter gecombineerd als OR-operaties. Met andere woorden, alle bestanden die getagd zijn als één van de geselecteerde tags worden geselecteerd. Dit beperkt ook meteen de mogelijkheden van filtering op tags. Figuur 2.3: KDBFS, de bestandsbeheer-applicatie van DBFS. 11

14 Tagsistant Tagsistant, voordien bekend als TagFS, presenteert tags als mappen in een hiërarchie. Na het laden van het bestandssysteem is een lijst te zien van alle tags in de vorm van mappen. Door een map te openen wordt een tag geselecteerd. Alle bestanden die getagd zijn met die tag zijn zichtbaar. Ook 2 speciale mappen zijn zichtbaar: AND en OR. Deze kunnen gebruikt worden om de tagselectie uit te breiden. Binnen Tagsistant zijn deze mapnamen geschreven met hoofdletters, om de leesbaarheid te bevorderen worden ze in deze tekst echter met kleine letters geschreven. Door naar de map /foto/and/verjaardag te gaan worden alle bestanden zichtbaar die getagd zijn met zowel de tag foto als de tag verjaardag. De map /verjaardag/and/foto geeft hetzelfde resultaat aangezien de tagselectie dezelfde tags omvat. De map /foto/or/film daarentegen toont alle bestanden getagd als foto, film of beide. OR heeft bovendien voorrang op AND. Dat wil zeggen dat de map /foto/and/verjaardag/or/nieuwjaar alle bestanden toont die getagd zijn als foto en verjaardag, alsook alle bestanden die getagd zijn als nieuwjaar. Eenvoudig weergegeven betekent dit: ( foto AND verjaardag ) OR nieuwjaar Om alle bestanden te selecteren die getagd zijn als verjaardag of nieuwjaar, maar ook foto, kan de map /foto/and/verjaardag/or/foto/and/nieuwjaar geopend worden: ( foto AND verjaardag ) OR ( foto AND nieuwjaar ) Naast deze basisfunctionaliteit ondersteunt Tagsistant ook plugins, wat autotagging toelaat. Zo kunnen bijvoorbeeld tags gegenereerd worden op basis van metadata van fotobestanden. Ten slotte wordt een applicatie, Tagman, meegeleverd waarmee relaties tussen tags aangegeven kunnen worden. Een eerste voorbeeld is de tag heavymetal. Via Tagman kan aangegeven worden dat een bestand getagd als heavymetal ook automatisch getagd wordt met de tag metal, aangezien deze kortere benaming vaak met hetzelfde doel gebruikt wordt. Een tweede voorbeeld is het aangeven dat wanneer de tags broer, zus, mama of papa toegepast worden, automatisch ook de tag familie toegepast wordt. Bij het kort testen van Tagsistant werkte het toch niet zo optimaal. Het was bijvoorbeeld niet duidelijk hoe (en of) bij het opslaan van een bestand meerdere tags kunnen toegekend worden. Een bestand opslaan in /tag1/and/tag2 resulteerde in een foutmelding. Hetzelfde gold voor /tag1/or/tag2. Het tonen van alle beschikbare bestanden na het selecteren van een tag leek ook niet zo handig omdat bij het selecteren van de tag foto er potentieel duizenden bestanden moeten weergegeven worden. Bij een steeds groter wordende lijst van bestanden kan dit negatieve gevolgen hebben op de performantie van het systeem. 2.3 Combinaties van hiërarchische en taggebaseerde bestandssystemen Zowel hiërarchische als taggebaseerde bestandssystemen hebben een aantal nadelen die het ander niet heeft. Door beide systemen te combineren wordt hieraan verholpen. Bestanden worden in een hiërarchie opgeslagen maar zijn ook geassocieerd met tags, waarop ze gefilterd kunnen worden. Op figuur 2.4 zijn dezelfde bestanden terug te vinden als getoond werd bij de uitleg over hiërarchische en taggebaseerde bestandssystemen. Men ziet een hiërarchie waarbij bestanden in 2 grote mappen opgedeeld zijn: Foto s en Iconen. Daarnaast is per bestand aangegeven welke tags ermee geassocieerd zijn. 12

15 Figuur 2.4: Zowel hiërarchie als tags Nadelen De bestaande systemen die binnen deze categorie vallen combineren hiërarchische en taggebaseerde bestandssystemen door deze naast elkaar te laten bestaan. De hiërarchie blijft behouden maar daarnaast zijn de bestanden ook bereikbaar vanuit een apart systeem waarmee tags toegekend kunnen worden en bestanden teruggevonden kunnen worden. Het grote nadeel is dat de systemen vrijwel los van elkaar functioneren. Bij het opslaan van een bestand kan bijvoorbeeld niet meteen aangegeven worden welke tags ermee geassocieerd worden, dit gebeurt achteraf. Een goede integratie van beide systemen ontbreekt Voorbeelden Stratus Stratus presenteert tags net als Tagsistant in een hiërarchie. Ook de structuur van deze is sterk gelijkend. Tags komen zo ook overeen met mappen. Bestanden komen overeen met symbolische links naar de echte bestanden. Stratus functioneert naast de bestaande hiërarchie. Om bestanden uit de bestaande hiërarchie in Stratus zichtbaar te maken worden symbolische links aangemaakt in een speciale map, die verwijzen naar alle mappen en bestanden die opgenomen moeten worden. Stratus indexeert deze automatisch. In de root van het Stratus bestandssysteem wordt een lijst van alle tags en bestanden getoond. Door een tag te selecteren wordt een lijst van combineerbare tags getoond alsook de bestanden die ermee getagd zijn. Door één van de tags te selecteren wordt de tagselectie uitgebreid. Alle combineerbare tags alsook bestanden die getagd zijn met beide tags worden weergegeven. De map /foto toont alle tags die gecombineerd kunnen worden met de tag foto alsook alle bestanden getagd als foto. De map /foto/2009 toont alle tags die gecombineerd kunnen worden 13

16 met de tags foto en 2009, alsook alle bestanden die getagd zijn als zowel foto als In Tagsistant werd ditzelfde bereikt door de map /foto/and/2009 te openen. Een nieuwe tag toevoegen in Stratus komt overeen met het aanmaken van een nieuwe map. Om een bestand te taggen kan het bestand gekopieerd worden in de map die overeenkomt met de tag. Wanneer een selectie /foto/2009 gemaakt is kan de tag 2009 van een bestand verwijderd worden door het bestand (weergegeven door een symbolische link) te verwijderen uit de map. Achter de naam van elk bestand plakt Stratus een lijst van alle tags die met het bestand geassocieerd zijn. De tags worden hierbij gescheiden door een dubbelpunt. Wanneer de bestandsnaam aangepast wordt kan deze lijst ook aangepast worden. Wordt een tag bij de lijst bijgevoegd, dan wordt het bestand als dusdanig getagd. Bestaat deze tag nog niet dan wordt de tag toegevoegd aan Stratus. Wanneer een tag uit de lijst verwijdert wordt is het bestand niet langer met die tag geassocieerd. Stratus heeft een aantal nadelen. Zo toont de root van het systeem alle bestanden, wat bij duizenden bestanden het systeem enorm kan vertragen. Ook de taglijst achter de bestandsnaam is niet zo handig. Een lijst van bestanden wordt daardoor al snel onoverzichtelijk. Het verwijderen van tags door het verwijderen van bestanden uit mappen is bovendien niet intuïtief en zorgt ervoor dat het effectief verwijderen van een bestand onhandig wordt. Hiervoor moet namelijk het originele bestand (in de hiërarchie) verwijderd worden. Het kan niet rechtstreeks vanuit Stratus XTagFS XTagFS is een taggebaseerd bestandssysteem voor Mac OS X. In het hiërarchische bestandssysteem gebruikt door Mac OS X (dit is typisch HFS+) is het mogelijk om voor elk bestand Spotlight Comments in te geven. Spotlight is de ingebouwde zoekmachine binnen Mac OS X. Via deze comments kan de zoekfunctie verbeterd worden. XTagFS beschouwt de comments als tags, waarbij een spatie een onderscheid maakt tussen verschillende tags. XTagFS indexeert deze en maakt een virtueel bestandssysteem aan, weergegeven binnen een hiërarchie. De werking hiervan loopt gelijk met deze van Tagsistant en Stratus: door tags (mappen) te openen kan gezocht worden naar bestanden. /foto/2009 toont aldus alle bestanden die getagd zijn als foto en De huidige versie van XTagFS laat enkel het openen van bestanden toe vanuit het virtuele bestandssysteem. Tags toekennen en verwijderen kan enkel via de Spotlight Comments. Dit maakt het systeem vrij onhandig in gebruik omdat het hiërarchisch en taggebaseerd deel bijna volledig los staan van elkaar Leap en Punakea Leap kan gebruikt worden naast Finder, de standaard bestandsbeheer-applicatie van Mac OS X. Het is een programma dat de mappenhiërarchie combineert met tags en metadata. Door een combinatie van verschillende filters kunnen bestanden gezocht worden. De werking hiervan is gelijkaardig aan die van KDBFS, de bestandsbeheer-applicatie van DBFS (zie puntje ). Eén van de handige punten is dat de selectie meteen beperkt kan worden tot een bepaald deel van de hiërarchie. Ook handig is dat op basis van de mappenstructuur waar het bestand zich bevindt, alsook metadata omtrent het bestand, automatisch bepaalde tags geassocieerd worden met het bestand. Om tags toe te voegen aan bestanden kan een bestand van om het even welke locatie in Finder naar een speciaal paneel aan de rand van het scherm gesleept worden waarna meteen tags ingegeven kunnen worden, die bovendien automatisch toegevoegd worden aan de Spotlight Comments. 14

17 Punakea is een applicatie met gelijkaardige doelstellingen als Leap. De interface is echter beperkter en bestanden moeten manueel toegevoegd en getagd worden. Het nadeel van zowel Leap als Punakea is dat het losstaande applicaties zijn naast Finder. Dit betekent dat in dialoogvensters voor het openen en opslaan van bestanden de functionaliteit van de applicaties (zoals o.a. de tags) niet gebruikt kan worden. Het toekennen van tags gebeurt dus altijd achteraf en om bestanden terug te vinden op basis van tags moet de applicatie gebruikt worden. 15

18 3 HierTag: integratie van een hiërarchisch en taggebaseerd bestandssysteem. Zowel hiërarchische als taggebaseerde bestandssystemen hebben een aantal nadelen. HierTag probeert hiervoor een oplossing te vinden door de 2 te combineren. Anders dan bij de systemen die dit principe reeds toepassen, zoals besproken in puntje 2.3, integreert HierTag de 2 systemen in plaats van deze naast elkaar te laten bestaan. 3.1 Hiërarchie HierTag implementeert een hiërarchie door een map uit het bestaande hiërarchisch bestandssysteem te spiegelen. Stel dat een gebruiker in zijn bestaand hiërarchisch bestandssysteem de mappen Bestanden, Gebruiker, Tags,... heeft. Binnen de map Bestanden is een bestand Verslag.doc aanwezig alsook een submap Foto s. In deze map Foto s zijn 2 bestanden aanwezig: Voetbal.jpg en Basketbal.jpg. Deze structuur is weergegeven op onderstaande figuur. Figuur 3.1 Bij de configuratie van HierTag wordt aangegeven welke map van de bestaande hiërarchie gespiegeld moet worden. In dit voorbeeld is dat de map /Bestanden. HierTag wordt geladen in een map naar keuze binnen de bestaande hiërarchie. Het lijkt aldus deel uit te maken van de bestaande hiërarchie. HierTag kan bijvoorbeeld geladen worden in de map /Tags. De structuur van het hiërarchisch bestandssysteem wordt: Figuur 3.2 De mappen en bestanden die in de map /Bestanden staan worden gespiegeld in de map /Tags. Wanneer een bestand of map toegevoegd, aangepast of verwijderd wordt in de map /Bestanden wordt die verandering gereflecteerd in de map /Tags. Wordt een bestand of map toegevoegd, aangepast of verwijderd in de map /Tags (dus binnen HierTag), dan wordt die verandering rechtstreeks doorgevoerd in de map /Bestanden. 16

19 Belangrijk is dat de bestanden en mappen slechts één keer worden opgeslagen, namelijk in de map /Bestanden. De bestanden en mappen binnen HierTag zijn virtueel. HierTag baseert zich voor het weergeven van de bestanden en mappen volledig op de map /Bestanden. HierTag kan geladen worden in een map naar keuze in het bestaande hiërarchisch bestandssysteem. Wordt het geladen in de map /Gebruiker/HierTag, dan zal het deze map zijn die de inhoud van de map /Bestanden spiegelt. Dit is te zien op onderstaande figuur. Figuur 3.3 Omdat om het even welke map gebruikt kan worden voor het laden van HierTag wordt bij de bespreking van paden binnen HierTag enkel het stuk genomen dat steeds hetzelfde is. In het bovenstaande voorbeeld zijn dit de volgende mappen en bestanden: /Foto s /Foto s/voetbal.jpg /Foto s/basketbal.jpg /Verslag.doc Tot dusver biedt HierTag nog geen enkel voordeel ten opzichte van het gebruik van de bestaande hiërarchie. HierTag voegt echter tagfunctionaliteit toe door in elke map binnen HierTag speciale mappen toe te voegen waarvan de naam voorafgegaan wordt door een +. Een voorbeeld: Figuur 3.4 Hoe deze speciale mappen precies werken wordt in de volgende punten uit de doeken gedaan. Tags worden binnen HierTag voorgesteld als mappen. Wanneer in de volgende uitleg gesproken wordt over tags worden mappen bedoeld met de naam van een tag. Een tag selecteren komt overeen met het openen van de map die de tag voorstelt. 17

20 3.2 Tags toevoegen In elke map binnen de hiërarchie wordt een speciale map +ADD toegevoegd. De werking van deze map is hieronder te zien. Figuur 3.5 Na het openen van de map +ADD is een lijst van alle tags te zien. Na het selecteren van een tag zijn 2 speciale mappen te zien: +AND en +SAVE. Deze laatste is een lege map. Door +AND te openen wordt opnieuw een lijst van alle tags weergegeven, met uitzondering van degene die reeds geselecteerd zijn. /+ADD/foto/+AND zal dus alle tags tonen behalve de tag foto. /+ADD/foto/+AND/2009/+AND zal alle tags tonen behalve de tags foto en Om één of meerdere tags toe te voegen aan een bestand wordt een bestand verplaatst naar de map +ADD, gevolgd door de toe te kennen tags. Door het bestand /Iconen/Voetbal.jpg (zie figuur 2.4) te verplaatsen naar /Iconen/+ADD/voet/+AND/nike, worden de tags voet en nike met het bestand geassocieerd. Merk hierbij op dat de +ADD-map gebruikt wordt die in de map staat waarin het bestand zich bevindt. Wanneer het bestand /Iconen/Voetbal.jpg verplaatst wordt naar /+ADD/voet,voet dan wordt de tag voet geassocieerd met het bestand Voetbal.jpg, maar wordt het bestand ook verplaatst van de map /Iconen naar de root ( / ). Het kan natuurlijk voorvallen dat een gewenste tag nog niet bestaat. Deze kan toegevoegd worden door het aanmaken van een map binnen de +ADD-map. Op de naam van een tag liggen momenteel wel een aantal restricties. Zo mogen tags enkel bestaan uit kleine letters, nummers en liggende streepjes. Spaties, accenten en andere speciale karakters zijn niet toegelaten en worden geweigerd. HierTag maakt het ook mogelijk om bij het opslaan van een bestand meteen een aantal tags aan te geven. Hiertoe wordt eerst naar de map in de hiërarchie gegaan waarbinnen het bestand opgeslagen moet worden. Vervolgens wordt de map +ADD geopend en worden de gewenste tags geselecteerd, gescheiden door +AND-mappen. Ten slotte wordt de map +SAVE geopend. Deze is leeg en duidt het eindpunt van de tagselectie aan. Om bijvoorbeeld een icoon van een tennisbal (Tennisbal.jpg) op te slaan kan de volgende map gebruikt worden: /Iconen/+ADD/tennisbal/+AND/icoon/+AND/bal/+AND/jpg/+SAVE Binnen de hiërarchie zal het Tennisbal.jpg bestand opgeslagen worden in /Iconen. Ook zullen meteen de tags tennisbal, icoon, bal en jpg geassocieerd worden met het bestand. Het is belangrijk het verschil op te merken tussen het toevoegen van een tag aan een bestaand bestand en aan een nieuw bestand. Bij een bestaand bestand wordt de +SAVE-map niet geselecteerd, terwijl dit bij een nieuw bestand wel gebeurt. Wanneer een bestand van buiten HierTag gekopieerd of verplaatst wordt naar HierTag, wordt dit ook beschouwd als een nieuw bestand. De +SAVE-map dient dus gebruikt te worden. De reden hierachter is een technische beperking die uitgebreider uitgelegd wordt in puntje Tags verwijderen Naast de +ADD-map is er ook een speciale +REMOVE-map aanwezig in elke map binnen de hiërarchie. De werking hiervan is hieronder afgebeeld en loopt grotendeels gelijk met deze van +ADD. 18

Operating Systems: Linux

Operating Systems: Linux Operating Systems: Linux Een introductie tot de installatie en het gebruik van Linux als Operating System 2008 Jochum van Weert 1 Linux Module v1.0 Inhoud Inhoud...2 1 Inleiding...4 2 Linux...5 2.1 Geschiedenis

Nadere informatie

Ontwerp en implementatie als Mash-Up

Ontwerp en implementatie als Mash-Up Ontwerp en implementatie als Mash-Up Groep 5 Maarten Decat 1e Master Ingenieurswetenschappen: Computerwetenschappen Optie Gedistribueerde systemen maarten.decat@student.kuleuven.be Benjamin Slegers 1e

Nadere informatie

De auteur van dit ebook kan op geen enkele manier verantwoordelijk gehouden worden voor eventuele onjuistheden in dit ebook.

De auteur van dit ebook kan op geen enkele manier verantwoordelijk gehouden worden voor eventuele onjuistheden in dit ebook. 2 Joomla ebook Bouw zelf een professionele website Disclaimer Bij de samenstelling van dit ebook is de grootst mogelijke zorg besteed aan de juistheid en correctheid van de informatie die in dit ebook

Nadere informatie

Wat zijn de mogelijkheden van sociale media in de CoCon software suite?

Wat zijn de mogelijkheden van sociale media in de CoCon software suite? Sociale media in conferentie applicaties Wat zijn de mogelijkheden van sociale media in de CoCon software suite? Project aangeboden door Elias Callens voor het behalen van de graad van Bachelor in de New

Nadere informatie

Overstappen van Windows naar Mac met OS X Mountain Lion

Overstappen van Windows naar Mac met OS X Mountain Lion Overstappen van Windows naar Mac met OS X Mountain Lion Jorg Kennis www.kennisonline.com Versie 2.1 1 Inhoudsopgave Overstappen van Windows naar Mac Over dit e-book 1. Inleiding 2. Het Dock en Launchpad

Nadere informatie

Antivirus software versus Malware

Antivirus software versus Malware Antivirus software versus Malware Bachelorscriptie door Anne Westerhof (0815012) Samenvatting Vroeger waren de enige kwaadaardige programma s virussen en als reactie hierop werd antivirus software uitgebracht.

Nadere informatie

Transformatie van een online blog naar een website met een Content Management Systeem (CMS)

Transformatie van een online blog naar een website met een Content Management Systeem (CMS) Transformatie van een online blog naar een website met een Content Management Systeem (CMS) Tim Vermoens Promotor: prof. dr. Guy De Tr Begeleiders: Daan Van Britsom, Joachim Nielandt Masterproef ingediend

Nadere informatie

Informatica Universiteit van Amsterdam. Ontwikkeling van User interfaces. Stephan van Eijkelenburg. 26 april 2010. Bachelor Informatica

Informatica Universiteit van Amsterdam. Ontwikkeling van User interfaces. Stephan van Eijkelenburg. 26 april 2010. Bachelor Informatica Bachelor Informatica Informatica Universiteit van Amsterdam Ontwikkeling van User interfaces Stephan van Eijkelenburg 26 april 2010 Supervisor(s): Dick van Albada, Andy Pimentel Signed: 2 Samenvatting

Nadere informatie

Windows 7 / 8.1 Basis

Windows 7 / 8.1 Basis Windows 7 / 8.1 Basis Inhoudsopgave 0. Inleiding... 3 1. Functionaliteiten Windows 7 en 8.1... 4 1.1 Inloggen in Windows 7 en Windows 8.x... 4 1.2 Programma s en bestanden in de taakbalk... 8 1.3 Aero

Nadere informatie

het werk mag kopiëren, verspreiden en doorgeven; het werk mag remixen en of er afgeleide werken mag van maken

het werk mag kopiëren, verspreiden en doorgeven; het werk mag remixen en of er afgeleide werken mag van maken COPYRIGHT Niets uit dit werk mag verveelvoudigd en/of openbaar gemaakt worden door middel van druk, fotokopie, microfilm, geluidsband, elektronisch of op welk andere wijze ook zonder voorafgaande schriftelijke

Nadere informatie

Technology Scout MediaMosa met meerdere content stores

Technology Scout MediaMosa met meerdere content stores Technology Scout MediaMosa met meerdere content stores Versie 1.5 Datum 3 februari 2010 SURFnet/Kennisnet Innovatieprogramma Inhoudsopgave INHOUDSOPGAVE... 2 SAMENVATTING... 4 INLEIDING... 6 STORAGETYPEN

Nadere informatie

Emulatie van Traffic Control in User-Mode Linux

Emulatie van Traffic Control in User-Mode Linux E07/ELO/09 Diepenbeek, 2007 Emulatie van Traffic Control in User-Mode Linux rapport over het eindwerk van Geert GERITS en Filip SCHREURS kandidaten voor de graad van industrieel ingenieur in de elektronica

Nadere informatie

Gebruikershandleiding

Gebruikershandleiding Gebruikershandleiding V1.0 Inhoudsopgave 1. VOORWOORD...4 2. MINIMALE SYSTEEMEISEN...4 3. INSTALLATIE VAN DE SOFTWARE...5 4. INLOGGEN...9 5. GEBRUIK VAN DE BACK-UP SOFTWARE...12 6. BACK-UP TAAK INSTELLINGEN...14

Nadere informatie

IN3405 - Bachelorproject. Factureringsproces. 18 juli 2008. Technische Universiteit Delft Faculteit EWI Technische Informatica

IN3405 - Bachelorproject. Factureringsproces. 18 juli 2008. Technische Universiteit Delft Faculteit EWI Technische Informatica IN3405 - Bachelorproject Factureringsproces Hidde Boomsma 1174371 Elger Lambert 1154273 18 juli 2008 Technische Universiteit Delft Faculteit EWI Technische Informatica Examen Commissie Yom Schutte Arjen

Nadere informatie

6/10 Bestandstoegang

6/10 Bestandstoegang Storage 6/10 Bestandstoegang 6/10.1 Beheer van bestandstoegang in Open Enterprise Server 2 In NetWare hoefde u eigenlijk helemaal niet na te denken over bestandstoegang. De toegang tot bestanden werd min

Nadere informatie

Snelstarthandleiding voor gebruikers

Snelstarthandleiding voor gebruikers Snelstarthandleiding voor gebruikers Inhoud Inleiding tot Web Creator Pro 6... 4 Snelstarthandleiding... 6 Een sjabloon openen... 6 Een afbeelding aanpassen... 9 Een element aan de pagina toevoegen...

Nadere informatie

H A N D L E I D I N G CONTENT MANAGEMENT SYSTEEM

H A N D L E I D I N G CONTENT MANAGEMENT SYSTEEM H A N D L E I D I N G CONTENT MANAGEMENT SYSTEEM Inhoudsopgave Introductie en inloggen 3 Overzicht van de basisfuncties 5 Voor content-editors 7 Maken en bewerken inhoud 8 Werken met afbeeldingen en documenten

Nadere informatie

MICROSOFT OUTLOOK 2000 EEN INLEIDING

MICROSOFT OUTLOOK 2000 EEN INLEIDING MICROSOFT OUTLOOK 2000 EEN INLEIDING MTSO-INFO 11 DIMITRI MORTELMANS 1999 Faculteit PSW Universiteit Antwerpen Contact: prof. dr. Dimitri Mortelmans (dimitri.mortelmans@ua.ac.be) Tel : +32 (03) 820.28.53

Nadere informatie

Site Management Handleiding voor Smartsite 4.5

Site Management Handleiding voor Smartsite 4.5 Site Management Handleiding voor Smartsite 4.5 Versie 2, juli 2002. 1997-2002 Smartsite Software B.V. Smartsite Dynamic Web System Disclaimer Hoewel deze handleiding met de grootste zorgvuldigheid tot

Nadere informatie

Eindverslag. TU Delft Library. Bachelor project - IN3405. Faculteit EWI - TU Delft

Eindverslag. TU Delft Library. Bachelor project - IN3405. Faculteit EWI - TU Delft TU Delft Library Bachelor project - IN3405 Eindverslag Auteurs: Tom Schenkels 1509349 Franklin Snellink 1509365 Erik van der Veen 1509381 Hugo van der Wijst 1516493 Commissie: Jessica van den Doel Marjolijn

Nadere informatie

Deel 1 Kennismaking. Docent: Jos Nys. (september 2010)

Deel 1 Kennismaking. Docent: Jos Nys. (september 2010) Deel 1 Kennismaking Docent: Jos Nys (september 2010) Inhoud 1. Wat is een CMS?... 3 2. Wat is?... 4 3. WampServer installeren... 9 4. downloaden en installeren...11 5. Front end back end... 13 6. Het Navigatiemenu...

Nadere informatie

EASION SURVEY HANDLEIDING DE ENIGE PROFESSIONELE ONDERZOEKSTOOL WAARBIJ DE DATA VAN U IS EN BLIJFT.

EASION SURVEY HANDLEIDING DE ENIGE PROFESSIONELE ONDERZOEKSTOOL WAARBIJ DE DATA VAN U IS EN BLIJFT. EASION SURVEY HANDLEIDING DE ENIGE PROFESSIONELE ONDERZOEKSTOOL WAARBIJ DE DATA VAN U IS EN BLIJFT. Datum: februari 2015 Versie: Release 2015_349_02 2015 Parantion Groep B.V. Deventer Handleiding Easion

Nadere informatie

Basishandleiding Welkom in de basishandleiding van Researchtool.

Basishandleiding Welkom in de basishandleiding van Researchtool. Basishandleiding Welkom in de basishandleiding van Researchtool. Met deze handleiding kunt u zelf snel en eenvoudig uw eigen onderzoek opzetten en uitvoeren. De opzet van de handleiding is zo dat u stapsgewijs

Nadere informatie

Officiële Gebruikershandleiding

Officiële Gebruikershandleiding Officiële Gebruikershandleiding Linux Mint 17.1 CINNAMON Editie Pagina 1 van 48 Inhoudsopgave INTRODUCTIE LINUX MINT... 4 HISTORIE...4 DOEL...4 VERSIENUMMERS EN CODENAMEN...5 EDITIES...6 WAAR IS HULP TE

Nadere informatie

Ontwerp en evaluatie van een OSGi en MHP gebaseerde applicatie voor een thuisomgeving van de toekomst

Ontwerp en evaluatie van een OSGi en MHP gebaseerde applicatie voor een thuisomgeving van de toekomst Faculteit toegepaste wetenschappen Vakgroep Informatie Technologie Voorzitter Prof. Dr. Ir. P. Lagasse Ontwerp en evaluatie van een OSGi en MHP gebaseerde applicatie voor een thuisomgeving van de toekomst

Nadere informatie

Gebruikershandleiding AthleticsManager 2013 (Nederlands)

Gebruikershandleiding AthleticsManager 2013 (Nederlands) 11 september 2013 Voorwoord Welkom bij de gebruikershandleiding van AthleticsManager. [PDF] Wij raden u aan om eerst rustig doorheen de handleiding te bladeren, om zo een initieel idee te krijgen van hoe

Nadere informatie

Gebruikershandleiding Athletics Manager

Gebruikershandleiding Athletics Manager Gebruikershandleiding Athletics Manager Versie: 2013v2 Voorwoord Welkom bij de gebruikershandleiding van AthleticsManager. Wij raden u aan om eerst rustig doorheen de handleiding te bladeren, om zo een

Nadere informatie

Bachelor eindproject

Bachelor eindproject Technische Universiteit Delft Bachelor eindproject Faculteit: Electrotechniek, Wiskunde en Informatica Sectie: Web Information Systems DENC Docs Studenten: Martijn Berger (1123076) Michael Croes (1265180)

Nadere informatie

Nijmegen, maart 2003 Afstudeerscriptie Michel Groenenstijn

Nijmegen, maart 2003 Afstudeerscriptie Michel Groenenstijn Nijmegen, maart 2003 Afstudeerscriptie Michel Groenenstijn VOORWOORD Na bijna zes jaar studeren is mijn studie Informatica bijna afgerond en kan ik terugkijken op de leukste en meest leerzame periode die

Nadere informatie

Copyright door het Ubuntu-handleidingteam. Enkele rechten voorbehouden. c b a

Copyright door het Ubuntu-handleidingteam. Enkele rechten voorbehouden. c b a Copyright door het Ubuntu-handleidingteam. Enkele rechten voorbehouden. c b a Dit werk is uitgebracht onder de Creative Commons A ribution Share Alike. License. Om een exemplaar hiervan te bekijken, zie

Nadere informatie