Moderne Besturingssystemen. dr. Patrick De Causmaecker

Maat: px
Weergave met pagina beginnen:

Download "Moderne Besturingssystemen. dr. Patrick De Causmaecker"

Transcriptie

1 Moderne Besturingssystemen dr. Patrick De Causmaecker

2 Inhoudsopgave 1 Klassieke concepten Wat en waarom Toepassingen Fabrieksautomatisatie Andere toepassingen Bureelautomatisering Classificatie, taxonomie Taxonomie Multi-processor op een bus (A) Multi-processor op een netwerk (B) Multi-computers op een bus (C) Multi-computers in een netwerk (D) Software Concepten Network File System Een echt gedistribueerd systeem? Communicatie in gedistribueerde systemen Overzicht Het gelaagde model Client/Server Remote procedure call (RPC) Synchronisatie in gedistribueerde systemen Klokken Fysieke klokken Wederzijdse uitsluiting Verkiezingsalgoritmen Atomaire transacties Gedistribueerde deadlocks i

3 Hoofdstuk 1 Klassieke concepten 1.1 Wat en waarom Van 1945 tot 1985 heersten centrale systemen. Deze varieerden in grootte van mini-computer tot mainframe. Van 1985 af groeide de concurrentie van de microcomputer. Deze leverde goedkope rekenkracht en voldoende comfort om aan de wensen van een modale gebruiker te voldoen. Het delen van (dure) infrastructuur zoals printers en schijf-eenheden leidde vanaf 1985 tot het ontwikkelen van het local area network (LAN). Dit delen van middelen veroorzaakt conflicten tussen gebruikers en processen waarvan de oplossing duidelijk op het niveau van het besturingssysteem moet gesitueerd worden. Vanaf dit ogenblik spreken we van een gedistribueerd systeem. Deze ontwikkeling is verder te begrijpen op economische gronden. Tot 1980 gold voor de prijs van computer-kracht de wet van Grosch: rekenkracht (prijs) 2 (1.1) Dit betekende dat men zijn mogelijkheden kon verviervoudigen door het dubbele uit te geven. Een verhoging van de capaciteit van een centrale computer loonde dus dermate dat men de overhead van een permanent bemand rekencentrum met zeer gespecialiseerde medewerkers kon compenseren door de verhoogde dienstverlening en efficiëntie aan de kant van de gebruikers. Bij de opkomst van goedkope microcomputer-technologie veranderde deze wetmatigheid. De mogelijkheden van deze goedkope chips konden niet zo gemakkelijk uitgebreid worden. Het gevolg was dat men enkel kwantitatief kon uitbreiden en de wet evolueerde naar een lineair verband: rekenkracht prijs (1.2) Met andere woorden, Mips-chips leverden een rekenkracht van Mips. Dit is een theoretische bovengrens, in werkelijkheid is communicatie noodzakelijk tussen de processoren wat de werkelijke rekenkracht nog verlaagt. Het werd dus economisch voordelig om veel kleine toestellen te kopen met een standaard uitrusting die volledig ter beschikking van één gebruiker konden staan en die in een netwerk verbonden waren om het delen van kritische infrastructuur mogelijk te maken. Anderzijds werd het conceptueel mogelijk om ingewikkelde berekeningen te verdelen over verschillende parallelle processoren of computers om de verwerking door parallelle processen te versnellen. Dit model, dat men overgenomen had uit de productie, bleek evenwel veel gecompliceerder dan men aanvankelijk had gedacht. Parallel processen is nog steeds een moeilijk gegeven waarvoor meestal ervaren en gespecialiseerde programmeurs noodzakelijk zijn. De automatisering van deze activiteit (het parallel uitvoeren van programma s die geschreven zijn voor een seriële processor) is een onderzoeksgebied. 1

4 1.2 Toepassingen Om de eisen die aan een gedistribueerd besturingssysteem gesteld worden, beter te begrijpen is het goed naar een mogelijke toepassing te kijken Fabrieksautomatisatie Probleemstelling Bij het automatiseren van de productie wordt op elk niveau intelligentie ingebouwd. Een sensor beslist of een bepaalde waarde acceptabel is of niet. De waarde die de sensor meet kan verbonden zijn met andere waarden voor dezelfde machine. er zal dus al gauw een centraal punt binnen de machine ontstaan waar meetwaarden met mekaar vergeleken worden. Dit centraal controle-orgaan moet de machine doen functioneren en volgt dus een programma dat stuur-signalen uitzendt. Het zal beïnvloed worden door de meetwaarden, om de machine te laten doen waarvoor ze ontworpen is. De machines vervullen taken in een een productieproces. Welke taken dit zijn, waar en wanneer die moeten uitgevoerd werd. Welke taken dit zijn, waar en wanneer ze moeten uitgevoerd worden, wordt niet op het niveau van de machines bepaald. Er is een intelligentie die de taken plant en daarbij bepaalde variabelen optimaliseert (kost, doorvoer-tijd, halen van deadlines,... ). Deze intelligentie beheert een bepaald machinepark, maar wordt op haar beurt gestuurd door de binnenkomende bestellingen en de economische processen die het bedrijf laten renderen. Welke activiteiten, hoe belangrijk zijn wordt dan wee op het niveau van het bedrijfsbeleid beslist. We zien dat er dus verschillende beslissing-niveau s zijn, en dat de verdeling of versnippering van de intelligentie toeneemt naarmate men meer gedetailleerd gaat kijken. Een centrale oplossing Men kan het grootste deel van deze beslissingen ondersteunen op een centraal niveau. Eens de metingen gedigitaliseerd zijn kunnen ze door een digitale computer worden verwerkt. De beslissingen worden dan vertaald in digitale stuur-signalen die slechts in de laatste stap naar de individuele machines gebracht worden. In Stad onder de sterren beschrijft Arthur C. Clarke een dergelijke situatie waar, een beetje karikaturaal, een centrale computer elk atoom in een ruimtestad controleert. Hierdoor ontstaat een wereld waarin slijtage niet meer bestaat. Afgezien van het het feit dat dit theoretisch onmogelijk is, heeft een dergelijke oplossing een aantal vervelende eigenschappen. 1. De stad hangt voor zijn voortbestaan af van de centrale computer. Als deze uitvalt valt het hele systeem stil. Er is geen zacht verval, het is alles of niets. (Arthur C. Clarke loste dit op door de computer ook zichzelf te laten controleren!) 2. Bij een uitbreiding moet men het model in de centrale computer aanpassen. Bij problemen met een machine moet het centraal model dynamisch aangepast worden. 3. De centrale eenheid is zwaar belast. De benadering heeft ook voordelen. 1. Alle informatie is op één punt aanwezig. Inconsistenties kunnen tot een minimum herleid worden. 2. Er is een duidelijk beeld van de investeringen. 3. Er is een duidelijk beeld van de operationele kosten. 2

5 Een hiërarchische oplossing Men kan de knopen in de hiërarchische structuur intelligent maken. Het beslissingsmodel wordt dan afgebeeld op de hardware en de software. Beide volgen de boomstructuur. Er zijn enige nadelen aan deze oplossing. 1. De informatie wordt versnipperd. 2. De investerings- en operationele kosten zijn minder transparant. 3. Inconsistenties kunnen ontstaan doordat het beeld van het systeem gedeeltelijk moet overgenomen worden door de verschillende componenten. Het is niet te vermijden dat hierbij bepaalde informatie dubbel opgeslagen wordt. Maar er zijn ook voordelen. 1. Flexibiliteit: het is mogelijk om wijzigingen te beperken tot het niveau waarboven ze niet meer gemerkt worden. 2. Robuustheid: het falen van één component hoeft niet de werking van het ganse systeem in het gedrang te brengen. 3. Schaalbaarheid: uitbreiding kan relatief gemakkelijk, enkel de bovenliggende knopen moeten aangepast worden. Hoewel dit hiërarchische model ontegensprekelijk voordelen heeft, is er toch nog steeds een centrale component aanwezig. Het uitvallen van een computer aan de top van een (sub)boom kan de werking van een hele sector of van het ganse systeem in het gedrang brengen. Bovendien vereist een wijziging nog steeds aanpassingen op verschillende niveau s. Men heeft dan ook nagedacht over alternatieven. Eén mogelijkheid is de heterarchische benadering. Een heterarchisch model In dit model is er geen centrale supervisie. Een productie-eenheid bestaat uit een aantal cellen die, met een bekende capaciteit, bepaalde taken aankunnen. Binnen een cel functioneren autonome componenten. Zij werken samen op basis van een onderhandelingsmodel. Dit is vaak op de economische wetmatigheid van vraag en aanbod gebaseerd. Een opdracht die een cel binnenkomt wordt toegekend aan de verschillende componenten in een volgorde die bepaald is door een kostenmodel. Er zijn enige nadelen en problemen. 1. Voorspelbaarheid: aangezien de gedetailleerde werking van het systeem bepaald wordt via een onderhandelingsmodel is het moeilijk om gedetailleerde voorspellingen te doen. 2. Het kostenmodel is moeilijk te definiëren, en pogingen leiden vaak tot ad hoc oplossingen waarvan men de werking niet goed begrijpt. De voordelen volgen uit de gronden voor de definitie: 1. Flexibiliteit: een nieuwe component kan zichzelf realiseren in de competitie voor opdrachten. Hij hoeft dus niet meer expliciet geïnstalleerd te worden. 2. Beperking van de informatiestroom tussen de componenten. De autonomie maakt het volledig inlichten van alle componenten overbodig. 3

6 3. Robuustheid: een defecte component kan de werking van het systeem niet in het gedrang brengen. 4. Zelf-organisatie via het onderhandelingsmodel Andere toepassingen Andere voorbeelden van toepassingen zijn wagens, kernreactoren, vliegtuigen, diensten-organisaties,... Herhaal de analyse voor een u bekend voorbeeld Bureelautomatisering In de bureelautomatisering is de distributie doorgedrongen via het gebruik van losse PC s. Deze vervingen aanvankelijk enkel de schrijfmachine. Vandaag worden PC s in netwerken verbonden om 1. Toestellen te delen (printer, scanner, archief). 2. Communicatie tussen mensen te verbeteren (mail, intranet) 3. De flexibiliteit te verhogen. Ook hier wordt er nagedacht over manieren om de beschikbare middelen beter te benutten. We denken bijvoorbeeld aan systemen die complexe bewerkingen op gegevens kunnen uitvoeren in de dode tijd van de aanwezige computers. Er zijn aan dit proces enige gevaren verbonden. 1. De gebruiker wordt geconfronteerd met een grote complexiteit. Het kan niet de bedoeling zijn dat de gebruiker de details van het netwerk kent. Hij moet integendeel een beeld voor zich krijgen dat coherent is. De computer op zijn bureel dient zich te gedragen als een gesprekspartner met een grondige kennis van wat er zich in het systeem afspeelt. Dit noemen we de single system image. Het is alsof alle intelligentie lokaal aanwezig is. 2. Fouten in het netwerk mogen de activiteiten van de medewerkers niet al te zeer beïnvloeden. Bij een lokale onderbreking moeten de meeste aangesloten werkstations nog verder kunnen functioneren. 3. De veiligheid en privacy moet op alle niveaus gewaarborgd zijn. Confidentialiteit en versleutelde communicatie dienen transparant verzekerd te zijn. 4. Authentisering moet ondersteund worden zodat de herkomst van een belangrijk bericht kan achterhaald worden Classificatie, taxonomie In 1972(!) definieerde Flynn de volgende categorieën voor parallelle systemen. SISD : Single Instruction Single Data SIMD : Single Instruction Multiple Data MISD : Multiple Instruction Single Data 4

7 MIMD : Multiple Instruction Multiple Data De Instruction en Data staan respectievelijk voor stromen van bevelen (het programma ) en stromen van gegevens. SISD is het model voor de klassieke computer (Mauchly, Eckert en Von Neumann, Von Neumann 1945) met één verwerkingseenheid waarin geen parallellisme is gerealiseerd. VE1 VE2 VEn G1 G2 Gn CG CE Figuur 1.1: SIMD met centraal geheugen SIMD ontstaat wanneer dezelfde bewerkingen op verschillende gegevens worden uitgevoerd. Een voorbeeld is de lus for(i = 0; i < 100; i = i + 1)A[i] = B[i] + C[i]; (1.3) die in de tijd van één optelling kan worden uitgevoerd indien er meer dan 100 optellers beschikbaar zijn. Ook als het aantal optellers kleiner is dan 100 kan deze lus bij parallelle verwerking sterk versneld uitgevoerd worden. Conceptueel heeft deze architectuur de vorm in figuur 1.1 Bij het uitvoeren van een programma zal de controle-eenheid de gegevens naar de individuele geheugens moeten brengen, en de verwerkingseenheden de juiste instructies moeten geven om tenslotte de resultaten uit de individuele geheugens terug te brengen naar het centrale geheugen. Het is duidelijk dat dit transporteren van data een bottleneck dreigt te worden. Men noemt deze oplossing SIMD met gedistribueerd geheugen. Een alternatief schema is te zien in figuur 1.2. Het centrale geheugen is hier weggelaten, en de verwerkingseenheden hebben toegang tot alle geheugenmodules in het systeem. Hierdoor wordt de controle-eenheid ontlast van het centrale geheugenbeheer. Voordeel is de hogere snelheid, nadeel is de mindere flexibiliteit van het ontwerp. Indien een iteratie dient uitgevoerd te worden, waarbij dezelfde bewerking verschillende keren op de gegevens wordt uitgevoerd, kan men meerder hardware-implementaties van deze bewerking voorzien, wat toelaat de gegevens in een pijplijn te verwerken. Dit principe wordt geïllustreerd in de figuur 1.3. Als toepassingen van deze vorm van parallelle dataverwerking vernoemen we Transformations van de pixels in een beeld 5

8 VE1 VE2 VEn G1 G2 Gn CE Figuur 1.2: SIMD zonder centraal geheugen Data IT. Stap IT. Stap IT. Stap IT. Stap IT. Stap Uitgang na n stappen Figuur 1.3: Parallelle iteratie in een pijplijn Berekeningen op eindig elementen modellen RISC processoren functioneren naar buiten toe als SISD machines, maar zijn inwendig voorzien van parallelle circuits. Het parallel maken van het programma gebeurt tijdens de uitvoering. Men komt tot prestaties van meer dan één instructie per klok-cyclus. (http://www.arstechnica.com/cpu/). MISD kan gebruikt worden bij zoek-problemen waar grote verzamelingen gegevens op één criterium worden gecontroleerd. MIMD is het meest algemene geval. Een pijplijn voor de optelling van reële getallen kan beschouwd worden als een MIMD systeem. Industriële voorbeelden zijn te vinden bij HP, SUN, SGI, IBM, Compaq. CISCO routers, SSL processors, MPEG decoders zijn processoren met een specifiek doel en gebruiken een parallelle architectuur om de verwerking te versnellen. Tenslotte worden er speciale, toepassingsgebonden processoren ontworpen voor het human genome project, simulatie van deeltjesversnellers, simulatie van stroomdynamica, enzovoort. 6

9 1.3 Taxonomie Men maakt traditioneel een onderscheid tussen multi-processor systemen en multi-computer systemen. Het verschil ligt in de mate van koppeling. Multi-processor systemen hebben meestal een gedeeld geheugen, terwijl multi-computersystemen meer onafhankelijk zijn en hoogstens voor het hoog-volume permanent geheugen en archivering gedeelde middelen gebruiken. Verder maakt men een onderscheid volgens de structuur van het communicatie-medium. Sterke koppeling gebeurt via een geschakeld netwerk terwijl minder sterk gekoppelde systemen over een bus communiceren. Multiprocessor Multicomputer Bus A C Geschakeld B D Figuur 1.4: Taxonomie van een gedistribueerd systeem Multi-processor op een bus (A) VE 1 VE 2 VE 3 Gedeeld Geheugen Figuur 1.5: Multi-processoren op een bus De performantie wordt bepaald door de snelheid van de processoren, de snelheid van het geheugen en de snelheid van de bus, maar ook door de aard van de applicaties. Als het aantal processoren te groot wordt zal, afhankelijk van het gevraagde bus-verkeer, de bus vroeg of laat een bottleneck worden. Het verkeer over de bus kan beperkt worden door elke processor te voorzien van een cache geheugen. Hierin wordt het deel van het geheugen gekopieerd dat momenteel door de processor gebruikt wordt. Als meerdere processoren met hetzelfde deel van het geheugen bezig zijn, ontstaat er een consistentieprobleem. De inhoud van de cache-geheugens gaat verschillen van de inhoud van het geheugen. Dit kan vermeden worden door de combinatie van twee strategieën: 7

10 Write-through: een leesoperatie kan steeds in de cache gebeuren, maar bij een schrijfoperatie wordt het centrale geheugen onmiddellijk aangepast. Snooping: elke processor beluistert continu de bus en maakt delen van de cache ongeldig als ernaar geschreven wordt. Bij een volgende leesoperatie zal dit deel vanuit het geheugen opgehaald worden Multi-processor op een netwerk (B) Als men in een systeem met n processoren en n geheugens elke processor verbindt met elk geheugen zijn er n(n 1)/2 verbindingen nodig. Deze lijnen zullen dus snel meer oppervlakte gaan innemen dan de processoren en geheugens samen. Om dit te verzachten bouwt men geschakelde netwerken. We bekijken de zogenaamde crossbar-switch en het omega-netwerk. De crossbar-switch G G G VE VE VE Figuur 1.6: Een crossbar switch met n = 3 Elke processor is verbonden met n schakelaars en elk geheugen is verbonden met dezelfde n schakelaars. Door de juiste schakelaar te bedienen kunnen er verschillende processoren simultaan toegang krijgen tot verschillende geheugens (zie figuur 1.6). Het aantal verbindingslijnen is 2n en het aantal schakelaars is n 2. Een pad van een processor naar een geheugen vereist het zetten van één schakelaar. De kostprijs van het netwerk is bepaald door het aantal schakelaars en deze neemt kwadratisch toe met de grootte van het multi-processor systeem. 8

11 Het omega-netwerk We beschouwen schakelaars met twee ingangen en twee uitgangen (zie figuur 1.7). Elke schakelaar heeft twee standen waarbij telkens twee koppels (ingang, uitgang) met mekaar verbonden zijn. Elke VE G VE G VE G VE G Figuur 1.7: Een omega-netwerk n = 4 schakelaar neemt in wezen één binaire beslissing. Om toe te laten dat één processor alle geheugens kan bereiken moeten er voldoende beslissingspunten zijn. Dit betekent: aantalschakelstappen log 2 (n) (1.4) Dit geeft aanleiding tot evenveel kolommen van schakelaars in de figuur. Elke kolom verbindt juist n ingangen met evenveel uitgangen, zodat er telkens juist n/2 schakelaars aanwezig zijn. Het aantal schakelaars in een omega-netwerk is dus n 2 log 2(n) (1.5) Dit maakt het goedkoper dan een crossbar-switch. Bij elke verbinding tussen een processor en een geheugen moeten log 2 (n) schakelaars gezet worden. Het is dus trager dan de crossbar Multi-computers op een bus (C) Zoals vandaag blijkt is het bouwen van een multi-computer zeer eenvoudig. Elke computer zijn eigen geheugen en randapparatuur. De communicatie tussen de computers gebeurt over een netwerk, dat 9

12 meestal een bus-topologie heeft. De communicatie tussen de computers is in het concept veel minder intens dan de communicatie in een multi-processor. Vandaar dat een relatief traag netwerk meestal kan volstaan. Hoewel caching in principe niet nodig is zullen we zien dat dit bij het delen van schijfgeheugen wel gebruikt wordt. een mooie oplossing voor het probleem van de inconsistentie bestaat in dit geval niet. Snooping is immers niet mogelijk. Het grootste deel van deze cursus zal over deze architectuur handelen Multi-computers in een netwerk (D) Netwerken van multi-computers kunnen verschillende topologieën gebruiken. Een raster kan gerealiseerd worden op een eenvoudige print (zie figuur 1.8). Elke computer die zich niet aan een rand Figuur 1.8: Een raster met torus topologie bevindt kan rechtstreeks communiceren met 4 naburen. Om de andere computers te bereiken dient hij beroep te doen op computers langs een pad. Door verbindingen te maken van rand tot rand ontstaat een torus. Hierin heeft elke computer exact vier naburen, en dit maakt het ontwerpen van programmatuur eenvoudiger. Een kubus wordt bekomen door 8 computers zo te schakelen dat elke computer drie naburen heeft Een kubus in vier dimensies heeft zestien hoekpunten waarin elk hoekpunt vier naburen heeft. Men kan dit gemakkelijk inzien door de coördinaten van de kubus in een assenstelsel te bekijken. In drie dimensies richten we het coördinatenstelsel zo in dat de oorsprong in het centrum van de kubus ligt, en dat de zijvlakken overeenkomen met de respectievelijke coördinaten 1 en -1 (Zie figuur 1.9). De hoekpunten hebben dan de coördinaten (1,1,1), (-1,1,1), (1,-1,1), (-1,-1,1), (1,1,- 1), (-1,1,-1), (1,-1,-1), (-1,-1,-1). Twee hoekpunten zijn onmiddellijk met mekaar verbonden indien 10

13 ( 1, 1,1) ( 1,1,1) (1, 1,1) (1,1,1) (1, 1, 1) (1,1, 1) ( 1,1, 1) Figuur 1.9: Een kubus in drie dimensies de coördinraten slechts op één positie van mekaar verschillen. Er is bijvoorbeeld een rechtstreekse verbinding tussen (1,1,1) en (1,1,-1), maar niet tussen (1,1,1) en (1,-1,-1). Om vanuit één hoekpunt een ander te bereiken dient men één voor één de coördinaten aanpassen, en dit kan dus maximaal op 3 posities nodig zijn. Men veralgemeent dit gemakkelijk tot 4 dimensies. De hoekpunten zijn dan (1,1,1,1), (-1,1,1,1), (1,-1,1,1), (-1,-1,1,1), (1,1,-1,1), (-1,1,-1,1), (1,-1,-1,1), (-1,-1,-1,1) (1,1,1,-1), (-1,1,1,-1), (1,-1,1,-1), (-1,-1,1,-1), (1,1,-1,-1), (-1,1,-1,-1), (1,-1,-1,-1), (-1,-1,-1,-1). Het langste pad tussen twee hoekpunten is heeft dan lengte 4. In n dimensies zijn er 2 n hoekpunten. Elk hoekpunt is met n naburen onmiddellijk verbonden. Het langste pad tussen twee hoekpunten heeft lengte n. Als men dus k computers volgens deze topologie met mekaar wil verbinden heeft men een kubus in n = log 2 (k) nodig. Per computer moet men n = log 2 (k) verbindingen voorzien. In totaal zijn er (k/2) log 2 (k) verbindingen nodig. Het langste pad heeft lengte n = log 2 (k). 1.4 Software Concepten Operating systems en software concepten zijn vaak minder goed gedefinieerd dan de hardware waarop ze uitgevoerd worden. Een onderscheid dat zeker gemaakt wordt is dit tussen zwakke en sterke koppelingen. Het systeem met een aantal personal computers met elk een eigen verwerking en geheugen, verbonden via een LAN, met een aantal randapparaten zoals printers, database servers, plotters, enz. is zwak gekoppeld. De componenten hebben een hoge mate van autonomie, de configuratie is zeer flexibel en robuust. Een multiprocessor die in real-time een ruimteschip bestuurt zal het andere uiterste vormen. In deze applicatie spelen fracties van een seconde een belangrijke rol en de componenten zullen perfect samenwerken en op basis van heel strikte contracten taken uitvoeren. We beschouwen nu een voorbeeld van een zwak gekoppelde software configuratie: NFS Network File System NFS is een vroeg voorbeeld van een netwerk operating system. Het concentreert zich op het beschikbaar maken van bestanden over een netwerk. We zullen via dit voorbeeld kennis maken met de vereisten als betrouwbaarheid, authenticatie, performantie, correctheid, flexibiliteit, schaalbaarheid en transparantie zoals die aan een gedistribueerd systeem worden opgelegd. NFS is tevens één van de eerste voorbeelden waarin het client/server principe gerealiseerd werd. Zonder een netwerk operating system is het toch mogelijk om resources te delen. Zo bijvoorbeeld kent UNIX het bevel rlogin dat toelaat om op een andere machine in het netwerk in te loggen. 11

14 File Server Client Client Aanvraag Antwoord Figuur 1.10: Een typische werkplek met client-machines en een NFS server Hierbij verandert de eigen lokale computer effectief in een terminal en kan men processen starten op het andere (remote) UNIX systeem. Een ander bevel is rcp. Het laat toe om bestanden te copiëren over het netwerk. Met rcpm achine1 : Bestand1M achine2 : Bestand2 (1.6) wordt het bestand Bestand1 op computer Machine1 gekopieerd naar bestand Bestand1 op computer Machine2. Telnet sessies, ftp, ssh,... zijn andere voorbeelden. Een nadeel bij al deze oplossingen is het gebrek aan transparantie. De gebruiker moet weten welke computers op het netwerk aangesloten zijn. Soms gaat dat via een naam, maar soms moeten fysieke adressen gekend zijn. Dit is een belasting van de gebruiker die in grotere systemen niet meer werkbaar is. Alleen al het vervangen van een computer of het verplaatsen van bestandensystemen zal problemen opleveren. Men heeft dit vrij vroeg opgemerkt en NFS is een eerste poging om hieraan tegemoet te komen. Het principe is dat machines die bestanden ter beschikking moeten stellen, ingesteld worden als fileservers. Deze nemen aanvragen van gebruikersprogramma s die op ander machines lopen in ontvangst en laten deze clients toe om bestanden te lezen om om erin te schrijven (figuur 1.10). de bestanden op de file server zijn georganiseerd in een hiërarchische structuur, een boomstructuur met een root directory en verschillende subdirectories. De clienten importeren een subboom van deze structuur en plaatsen deze in hun eigen boomstructuur. Ze zijn daarbij vrij in het kiezen van de plaats. Eens dit gebeurd is (men spreekt van mounten ) is de subboom van de file server toegankelijk via de boom van de client. De gebruikersprogramma s zullen het verschil niet meer merken. De losse koppeling komt hier naar voor in de vrije keuze van de plaats waar een subboom in de eigen hiërarchie gemounted wordt. Er is geen enkele garantie noch reden waarom verschillende clienten dezelfde boomstructuur zouden gebruiken. NFS werd oorspronkelijk door SUN Microsystems bedacht en geïmplementeerd voor gebruik op UNIX werkstations. Het is ondersteund in alle UNIX en LINUX implementaties en het is ook vanuit Windows bruikbaar. NFS architectuur Het onderscheid tussen client en server is niet machine-gebonden. wanneer een computer ingesteld wordt als een server betekent dit dat een proces gestart wordt dat aanvragen kan ontvangen en 12

15 client server gemounted geexporteerd Figuur 1.11: Het werkingsprincipe van de NFS mount. beantwoorden. Een client is dan een proces dat aanvragen lanceert. Deze aanvragen kunnen dus zowel van dezelfde als van andere computers afkomstig zijn. De l;ijst van directories die een server ter beschikking stelt wordt bijgehouden in een bestande /etc/exports. Hierin worden tevens een aantal regels voor het gebruik aangegeven. Clienten gebruiken ge-exporteerde directories door ze te mounten. Hierbij zal de gemounte directory deel gaan uitmaken van de eigen hiërarchie (zie figuur 1.11). Op deze manier kunnen ook schijfloze clienten ingesteld worden om een schijfruimte op een ander station te gebruiken. Clienten met een eigen schijf kunnen hun bestandensysteem uitbreiden. Twee clienten die dezelfde directory mounten kunnen de gemeenschappelijke bestanden gebruiken. Hiervoor zijn verder geen maatregelen nodig. NFS is conceptueel dus zeer eenvoudig. NFS protocollen De interface tussen clients en servers is essentieel en moet goed gedefinieerd worden. Indien men een client-toepassing schrijft dient deze op alle implementaties te werken. Een protocol is een verzameling aanvragen die door clients naar servers worden gestuurd, samen met de antwoorden die de servers hierop terug kunnen sturen. Buiten de protocollen dient bij de client geen kennis over de structuur van de server vereist te zijn. De client beschouwt de server als een black box. MOUNT Dit is het eerste protocol waarbij de client toegang krijgt tot een specifieke directory. De client stuurt een pad naar de server en vraagt vergunning om de betreffende directory in zijn eigen hiërarchie te mounten. De server controleert of de padnaam correct is, en of de opgegeven directory geëxporteerd is. In dit geval levert hij een filehandle af die de client zal gebruiken bij alle verdere toegangen. Clients kunnen zo ingesteld worden dat ze bij de opstart een reeks mounts uitvoeren. Op die manier krijgen de gebruikers steeds dezelfde machine functies aangeboden. Om onnodige vertragingen bij het opstarten te vermijden maakt men gebruik van een automount functie die de directories slechts mount als de eerste aanvraag gelanceerd wordt. Dit schept mogelijkheden voor spiegelen waarbij de server die het eerst reageert gekozen wordt (dit is een primitieve vorm het balanceren van de belasting). We moeten ons uiteraard wel realiseren dat het dupliceren van bestanden door NFS niet ondersteund wordt. De consistentie tussen gespiegelde servers zal dus op applicatieniveau moeten gegarandeerd worden. 13

16 Een verzameling NFS protocollen regelt de toegang tot directories en files. Er bestaat geen OPEN en teen CLOSE aanvraag. NFS servers houden dus geen lijst bij van welke clienten met welke bestanden aan het werken zijn. De reden hiervoor is schaalbaarheid en betrouwbaarheid. Het bijhouden van lijsten over clienten is een belasting die stijgen met het aantal clienten. Dit is dus niet schaal-invariant. Het bijhouden van open bestanden zou verder inhouden dat de client op de server moet vertrouwen voor deze bestandsinformatie. Bij het uitvallen en terug opstarten van de server kan dit tot problemen leiden. LOOKUP Om een bestand te lezen moet de client een LOOKUP aanvragen. Hierbij wordt een bestandsnaam opgezocht in de directory-structuur van de server. Het resultaat is een filehandle die bij daaropvolgende READ of WRITE aanvragen gebruikt wordt. De bij deze laatste aanvragen doorgezonden informatie bevat een offset en een grootte van het te lezen deel van het bestand. De server hoeft dus ook hier niks bij te houden tussen twee oproepen en wordt dan ook toestandsloos genoemd. (Een systeem met een toestand is bijvoorbeeld RFS in UNIX SV). Door deze toestandsloze manier van werken ontstaan wel een aantal problemen. Hier vermelden we het op slot zetten van een bestand dat in UNIX mogelijk is maar dat niet zonder meer door de server kan geïmplementeerd worden. Authenticering gebeurt via het NIS (Network Information System) waarin publieke sleutels worden bijgehouden. Elke client heeft zijn eigen private sleutel waardoor zijn identiteit kan gecontroleerd worden door de server. Om de bedrijfszekerheid te verhogen werkt NIS met een master/slave principe. Hierin worden de tabellen gedupliceerd. Na een wijziging zijn er tijdelijk fouten mogelijk. NIS werd vroeger yellow pages genoemd en yp komt nog steeds voor in de naamgeving van de bevelen die NIS bedienen (ypwhich, ypset,...) NFS implementatie De implementatie van NFS is geen deel van het NFS systeem. Toch is het interessant om te zien hoe het in het UNIX bestandensysteem is ingepast. De client benadert bestanden via de systeemaanroepen (system calls). Transparantie vereist dat programma s geen onderscheid merken tussen remote bestanden en lokale bestanden. Dit wordt gerealiseerd door een extra laag, het virtuele file systeem (VFS). Een lokaal bestand zal volgens de normale UNIX strategie bediend worfden, een remote bestand via NFS (zie figuur 1.12). In het VFS wordt een tabel bijgehouden met per open bestand één element. Dit is vergelijkbaar met de i-nodes. In VFS spreken we evenwel van de v-node. Hierin is aangeduid of het om een lokaal of om een remote bestand gaat. Voor een lokaal bestand bevat de v-node een i-node. Voor een remote bestand is er een r-node. Een r-node verwijst naar een element van de tabellen in de NFS client waar zich de filehandle bevindt. Bij het openen van een bestand zal de NFS client de padnaam opzoeken bij de server en de filehandle opslaan in een nieuwe r-node. De VFS zal deze opslaan in zijn v-node. Hierop ontvangt de aanroeper een file descriptor voor de remote file. De tabellen in VFS verbinden de file descriptor met de gepast v-node Bij een READ zal niet alleen het gevraagde blok getransfereerd worden, maar meestal meer. Normaal wordt een blok van 8192 bytes groot overgebracht volgens een read ahead principe. Eenzelfde procedure wordt gebruikt bij een WRITE. Deze resulteert pas in een transfer als het blok van 8192 volledig gebruikt is. Zoals UNIX normaal voor lokale bestanden caches gebruikt, doet ook NFS dit. Clienten hebben caches voor file attributen (cfr. i-node cache in UNIX) en voor bestandsinhoud. Dit vermindert uiteraard het netwerkverkeer. 14

Netwerken & Internetten Inhoud

Netwerken & Internetten Inhoud Forensische informatica Netwerken & Internetten 1-59 Netwerken & Internetten Inhoud Netwerken & Internetten... 1 Inhoud...1 1. Netwerken...3 1.1. Inleiding...3 1.2. Wat is een netwerk?...3 1.3. Soorten

Nadere informatie

Jonathan Van Eeckhoudt. Collaboratieve modellen in een Webomgeving

Jonathan Van Eeckhoudt. Collaboratieve modellen in een Webomgeving Dankwoord Graag zou ik mijn promotor, Prof. Dr. Olga De Troyer bedanken voor de verbeteringen, opmerkingen en hulp die zij mij gegeven heeft. Mede door haar goede raad heeft ze me op het goede spoor gezet.

Nadere informatie

Masterproef Automatic update and inventory application

Masterproef Automatic update and inventory application Masterproef Automatic update and inventory application Studiegebied Industriële wetenschappen en technologie Opleiding Master in de industriële wetenschappen: Elektronica-ICT Afstudeerrichting Informatie-

Nadere informatie

1 Algemeen. 1.1 Definities en begrippen. ICT-Zakboek, 3e Druk, Reed Business, 2007

1 Algemeen. 1.1 Definities en begrippen. ICT-Zakboek, 3e Druk, Reed Business, 2007 1 Algemeen 1.1 Definities en begrippen Een alomvattende, eenduidige definitie van een computernetwerk bestaat niet. Wel is er een aantal kenmerkende eigenschappen te geven welke gezamenlijk een operationele

Nadere informatie

Experimentele studie van een NAT dienst met behulp van netwerkprocessoren

Experimentele studie van een NAT dienst met behulp van netwerkprocessoren Faculteit Toegepaste Wetenschappen Vakgroep Informatietechnologie Voorzitter: Prof. Dr. Ir. P. LAGASSE Experimentele studie van een NAT dienst met behulp van netwerkprocessoren door Wim VAN DE MEERSSCHE

Nadere informatie

1 Dataopslag 1.1 RAID

1 Dataopslag 1.1 RAID 1 Dataopslag Gegevens in het werkgeheugen van een computersysteem zijn vluchtig. Daarmee bedoelen we dat deze gegevens verdwijnen als het systeem wordt uitgeschakeld of wanneer een programma in het geheugen

Nadere informatie

GENERIEK ACCOUNTING FRAMEWORK

GENERIEK ACCOUNTING FRAMEWORK GENERIEK ACCOUNTING FRAMEWORK Arthur de Jong afstudeerverslag 2001 01 30 West Consulting BV Delftechpark 5 2628 XJ Delft Postbus 3318 2601 DH Delft 015 219 1600 http://www.west.nl/ info@west.nl Technische

Nadere informatie

THUISNETWERKEN. Peer-to-Peer netwerken tot 10 PC s

THUISNETWERKEN. Peer-to-Peer netwerken tot 10 PC s THUISNETWERKEN Peer-to-Peer netwerken tot 10 PC s Hardware- en softwarematig opzetten van een Peer-to-Peer netwerk Beheer van gebruikers en hun machtigingen Carl Maegerman www.lesgever.be INHOUDSOPGAVE

Nadere informatie

4 Servers 77 4 SERVERS. Waarin de koningen van een computernetwerk eigenlijk eerder dienaars van hun netwerkvolk blijken te zijn.

4 Servers 77 4 SERVERS. Waarin de koningen van een computernetwerk eigenlijk eerder dienaars van hun netwerkvolk blijken te zijn. 4 Servers 77 4 SERVERS Waarin de koningen van een computernetwerk eigenlijk eerder dienaars van hun netwerkvolk blijken te zijn. 78 www.sleutelboek.eu 4.1 Client/server-verwerking Het begrip client/server

Nadere informatie

8/2 GroupWise. 8/2.1 GroupWise als groupwareoplossing

8/2 GroupWise. 8/2.1 GroupWise als groupwareoplossing Mail & Messaging 8/2 GroupWise 8/2.1 GroupWise als groupwareoplossing Als bijzondere toepassing voor de communicatie in netwerken (het werken in groepen) moet beslist het product GroupWise van Novell worden

Nadere informatie

Wireless Leiden. Afstudeerverslag. Eduroam bij Wireless Leiden 802.1x

Wireless Leiden. Afstudeerverslag. Eduroam bij Wireless Leiden 802.1x Wireless Leiden Eduroam bij Wireless Leiden 802.1x Afstudeerverslag Naam : Richard van Mansom Organisatie : Wireless Leiden Datum : 9 Juni 2008 Opleiding : Hogeschool Leiden Informatica Document : Afstudeerverslag

Nadere informatie

Vb.net planningstool en Scada applicatie

Vb.net planningstool en Scada applicatie Masterproef VB.net planningstool en Scada applicatie Studiegebied Industriële wetenschappen en technologie Opleiding Master of Science in de industriële wetenschappen: elektrotechniek Afstudeerrichting

Nadere informatie

Firewalls en IDS. door Dieter Handschoewerker. Firewalls en IDS Pagina 1/80

Firewalls en IDS. door Dieter Handschoewerker. Firewalls en IDS Pagina 1/80 Firewalls en IDS door Dieter Handschoewerker Firewalls en IDS Pagina 1/80 Inhoudstabel Introductie 4 Deel 1 : Firewalls 5 Definitie van een firewall 5 Kenmerken van een firewall 5 Waartegen een firewall

Nadere informatie

9 Conclusie 109. A Publisher API 111. B Custody en ownership API 113. C Inquiry API 114. D Replication API 116

9 Conclusie 109. A Publisher API 111. B Custody en ownership API 113. C Inquiry API 114. D Replication API 116 Inhoudsopgave 1 Ontstaansgeschiedenis van web services 5 1.1 Evolutie van de architectuur van informatiesystemen..... 5 1.1.1 One-tier.......................... 6 1.1.2 Two-tier..........................

Nadere informatie

Emulatie van Traffic Control in User-Mode Linux

Emulatie van Traffic Control in User-Mode Linux E07/ELO/09 Diepenbeek, 2007 Emulatie van Traffic Control in User-Mode Linux rapport over het eindwerk van Geert GERITS en Filip SCHREURS kandidaten voor de graad van industrieel ingenieur in de elektronica

Nadere informatie

Katholieke Universiteit Leuven

Katholieke Universiteit Leuven Katholieke Universiteit Leuven Faculteiten Wetenschappen en Toegepaste Wetenschappen BEVEILIGING VAN MEDISCHE INFORMATIESYSTEMEN Tim DENOULET Mathieu DESMET Eindverhandeling aangeboden tot het behalen

Nadere informatie

Telecommunicatiediensten voor het koppelen van locaties in de zakelijke markt

Telecommunicatiediensten voor het koppelen van locaties in de zakelijke markt Telecommunicatiediensten voor het koppelen van locaties in de zakelijke markt In opdracht van: OPTA Project: 2010.047 Publicatienummer: 2010.047.1021 Datum: Utrecht, augustus 2010 Auteurs: ir. ing. Reg

Nadere informatie

6/4 SAN, Storage Area Network

6/4 SAN, Storage Area Network 6/4 SAN, Storage Area Network Storage 6/4.1 iscsi en Novell Cluster Services De term high availability is een van de nieuwe buzz-words. Elke zichzelf respecterende organisatie heeft het erover. Toch zie

Nadere informatie

Intelligent back-up systeem voor DMX-gestuurd lichteffect

Intelligent back-up systeem voor DMX-gestuurd lichteffect Universiteit Gent Faculteit Ingenieurswetenschappen Intelligent back-up systeem voor DMX-gestuurd lichteffect Project in het kader van het Vakoverschrijdend Projectvak in de Bachelor Computerwetenschappen

Nadere informatie

Aanbevelingen en kwaliteitscriteria voor ziekenhuisinformatiesystemen

Aanbevelingen en kwaliteitscriteria voor ziekenhuisinformatiesystemen Aanbevelingen en kwaliteitscriteria voor ziekenhuisinformatiesystemen (versie 1 december 2002) Prof. Dr. Bart Van den Bosch Prof. Erwin Bellon André De Deurwaerder Mark Vanautgaerden Dr. Marc Bangels Inhoud

Nadere informatie

Datacom ICT3/4. H1 Internetwerken H3 Internet-protocollen H4 Introductie tot het Cisco IOS H5 IP-routeren

Datacom ICT3/4. H1 Internetwerken H3 Internet-protocollen H4 Introductie tot het Cisco IOS H5 IP-routeren Sybex Cisco CCNA Reader Datacom ICT3/4 H1 Internetwerken H3 Internet-protocollen H4 Introductie tot het Cisco IOS H5 IP-routeren Appendix A Inleiding tot het Cisco IOS Praktijkoefeningen Hoofdstuk 1 Internetwerken

Nadere informatie

1 Klassiek lagenmodel vs. TCP/IP

1 Klassiek lagenmodel vs. TCP/IP 1 Klassiek lagenmodel vs. TCP/IP 1.1 Inleiding Om alle netwerkhardware met elkaar te laten communiceren zijn er communicatieprotocollen nodig. Deze verzameling afspraken zorgt ervoor dat we samen met de

Nadere informatie

Onderzoek naar een professionele ICT infrastructuur. Andree Toonk Leendert van Doesburg

Onderzoek naar een professionele ICT infrastructuur. Andree Toonk Leendert van Doesburg Onderzoek naar een professionele ICT infrastructuur Andree Toonk Leendert van Doesburg 2 februari 2004 Samenvatting In de huidige maatschappij worden ICT diensten steeds belangrijker. Een trend is dat

Nadere informatie

Avatar Animation in Networked Virtual Environments. Maarten Wijnants

Avatar Animation in Networked Virtual Environments. Maarten Wijnants Avatar Animation in Networked Virtual Environments Maarten Wijnants 2 juni 2003 Inhoudsopgave Voorwoord 1 Samenvatting 2 1 Inleiding 3 2 Networked Virtual Environments 5 2.1 Inleiding..................................

Nadere informatie

Ontwerp en evaluatie van een OSGi en MHP gebaseerde applicatie voor een thuisomgeving van de toekomst

Ontwerp en evaluatie van een OSGi en MHP gebaseerde applicatie voor een thuisomgeving van de toekomst Faculteit toegepaste wetenschappen Vakgroep Informatie Technologie Voorzitter Prof. Dr. Ir. P. Lagasse Ontwerp en evaluatie van een OSGi en MHP gebaseerde applicatie voor een thuisomgeving van de toekomst

Nadere informatie

A X S GUARD À LA CARTE

A X S GUARD À LA CARTE A X S GUARD À LA CARTE 1 Inhoud 1 Inhoud...2 2 3 Copyrights en gebruiksvoorwaarden...3 Over dit document...3 4 Wat is axs GUARD?...4 5 Wat is de à la Carte Configurator?...4 6 7 Wat zijn axs GUARD performance

Nadere informatie

Technische aspecten van datacommunicatie

Technische aspecten van datacommunicatie HOOFDSTUK 2 2.1 Meer over netwerken 2.1.1 Geschiedenis Vóór 1970 was er alleen sprake van computersystemen waaraan terminals waren gekoppeld. Elke handeling op al die toetsenborden werd in dat ene systeem

Nadere informatie

Implementatie van een layer 3 bedrijfsnetwerk

Implementatie van een layer 3 bedrijfsnetwerk Implementatie van een layer 3 bedrijfsnetwerk Project aangeboden door Van Hove Tommie voor het behalen van de graad van Bachelor in de New Media and Communication Technology Academiejaar 2013-2014 Stageplaats

Nadere informatie

Technology Scout MediaMosa met meerdere content stores

Technology Scout MediaMosa met meerdere content stores Technology Scout MediaMosa met meerdere content stores Versie 1.5 Datum 3 februari 2010 SURFnet/Kennisnet Innovatieprogramma Inhoudsopgave INHOUDSOPGAVE... 2 SAMENVATTING... 4 INLEIDING... 6 STORAGETYPEN

Nadere informatie

8 Netwerken en Internet

8 Netwerken en Internet Hoofdstuk 8 Netwerken en Internet 119 8 Netwerken en Internet 1 COMMUNICATIE We must be able to communicate with anyone, at any time, anywhere De menselijke taal ontstond ergens in de ontwikkeling van

Nadere informatie