Media Content Storage

Maat: px
Weergave met pagina beginnen:

Download "Media Content Storage"

Transcriptie

1 WHITE PAPER Media Content Storage Opslag van statische data op een andere manier bekeken Door Kurt Glazemakers CTO Terremark Europe Inhoud

2 Hoe doen we het nu 3 Flessenhals 3 Prijskaartje 4 Ontkoppeling 6 CAS lost het op 6 Onafhankelijke Identifiers 6 Snel maatwerk 8 Conclusie 9 White Paper Media Content Storage 2

3 Introductie Bij veel websites die gebruik maken van afbeeldingen, videobeelden en andere statische bestanden als dienst voor particulieren (denk aan YouTube, Flick-R of Uitzending gemist) of voor een bedrijfsapplicatie (röntgenfoto s, luchtfoto s), richtten we traditioneel voor de opslag een NAS of SAN in, dat we opschaalden naarmate de behoefte aan capaciteit toenam. Om de totale behoefte te berekenen, gebruikten we vaak het rekenmodel aantal gebruikers x capaciteit. Is dat wel de juiste benadering? Dat valt te betwisten. In dit whitepaper gaan we in op de knelpunten van de gangbare benadering bij de opslag van statische data om vervolgens een zeer zinvol alternatief te bespreken. Het alternatief heet Media Content Storage en het omvat een compleet andere, maar zeer logische aanpak om grote hoeveelheden statische informatie op te slaan. Hoe doen we het nu Voor het uploaden van statische bestanden zal de eindgebruiker generiek een webpagina met een eenvoudige interface gebruiken. Na het geven van de instructie om een bestand te uploaden, verwerkt de onderliggende applicatie deze aanvraag en post het bestand naar de storage-laag. Daarbij slaat de applicatie metadata op bij het bestand, waaronder een veld met daarin het pad naar het bestand. Dit pad kan na verloop van tijd echter veranderen wanneer we gegevens verplaatsen naar andere directories of zelfs naar andere systemen. Bij een dergelijke oplossing moet je de applicatie aanpassen op het moment dat je opslagmedia toevoegt. Dit resulteert op een grotere schaal al snel in moeilijke, foutgevoelige en daardoor kostbare processen. Bovendien moeten voor updates en onderhoud de systemen vaak tijdelijk uit de lucht Flessenhals Door het SAN of het NAS aan de applicatieserver te koppelen en deze al het beeldmateriaal te laten opslaan, creëren we een flessenhals. De I/O ligt vast en kan maar tot een bepaald niveau opschalen om aanvragen voor beeldmateriaal te verwerken. Bij een groot aantal aanvragen loopt de wachttijd voor de gebruikers op - met als gevolg het ongewenste effect dat mensen afhaken of erger nog, hun werk niet meer kunnen doen. White Paper Media Content Storage 3

4 White Paper Media Content Storage 4

5 Prijskaartje Een snel uitdijend datavolume met statische bestanden vraagt veel van de verantwoordelijke IT-manager, waardoor de TCO per MB groeit bij oplossingen die op harde schijven zijn gebaseerd. Hieronder staan de meest belangrijke redenen: Op harde schijven gebaseerde opslagoplossingen verhogen de overheadkosten, omdat ze bestaan uit disksets waaraan componenten zijn toegevoegd om de ruwe schijfcapaciteit te verrijken met functionaliteit. Voorbeelden hiervan zijn de highend, redundante controllers van een Fibre Channel SAN en de benodigde software voor het beheer van een dergelijk opslagmedium; Ze gebruiken RAID1-configuraties om het risico op dataverlies door het falen van de schijf te reduceren door middel van replicatie over meerdere schijven. Elk bestand behoeft daarom meer ruwe schijfruimte dan de werkelijke omvang van het bestand; Het beheer van een grote dataset vereist zorgvuldige planning en wordt lastiger (en dus duurder) naarmate het datavolume groeit. Men schat dat het beheer van de opgeslagen data zeven maal de kosten bedraagt van de harde schijf waarop de data staat; Storage-engineers werken met verschillende product- /merkspecifieke tools en moeten informatie uit verschillende applicaties correleren; het is voor een engineer normaal om vier of vijf schermen actief te hebben om relevante (bedrijfs)informatie te verzamelen uit verschillende managementen monitoring-modules. Dit resulteert in een foutgevoelige, arbeidsintensieve en daarmee improductieve benadering van storage-beheer; Tenslotte leiden de ogenschijnlijk dalende kosten voor dataopslag (wanneer we alleen naar de directe kosten kijken en niet naar de verborgen kosten) tot uitstel van beslissingen aangaande de implementatie van een databeheeroplossing, al dan niet inclusief lifecycle-management. Het aantal manuren voor beheer van de infrastructuur groeit als gevolg van het stijgende datavolume en de daarmee gepaarde complexiteit. 1 RAID is een overkoepelende term voor opslagmethodieken die data kunnen verdelen en repliceren over meerdere harde schijven. White Paper Media Content Storage 5

6 Ontkoppeling De bovenstaande argumentatie verduidelijkt dat het raadzaam is om naar een andere manier te kijken om statische data op te slaan. Idealiter zouden de bestanden niet direct gekoppeld moeten zijn aan één opslagmedium of aan de applicatie. Tegelijkertijd moet de controle over de bestanden toenemen om de ontdubbeling te kunnen regelen en zo efficiënter met de capaciteit om te gaan, te bepalen hoelang we bepaalde bestanden moeten bewaren en welke bestanden eventueel offline beschikbaar moeten blijven. CAS lost het op De oplossing zit in een concept, waarbij de (web)applicatie noch de storage-laag zelf, zich hoeven bezig te houden met het beheer van de bestanden. Gebruik van CAS (content adressing system) maakt het mogelijk zo n concept invulling te geven. CAS is een term die zijn herkomst vindt bij Paul Carpentier en Jan van Riel, die destijds werkzaam waren bij het Belgische FilePool (in 2001 door EMC overgenomen). Het systeem benadert dataopslag en -retrieval op een geheel andere manier. Gegevens slaan we vaak op in een structuur van directories en mappen (een omgekeerde boomstructuur ). De naam van de map beschrijft de inhoud en elke map kan submappen bevatten, waarin subsets van informatie staan. Computersystemen hebben deze logisch gestructureerde benadering echter niet nodig en CAS laat dat gegeven dan ook geheel los. Op opslagniveau is geen logische structuur er is één grote depository van bestanden met elk een unieke identifier. Onafhankelijke Identifiers CAS gebruikt een Global Unique Identifier (GUID) voor het opslaan van statische data. Deze GUID is onafhankelijk van elk lokaal of netwerkpad, waardoor noch de applicatie noch de eindgebruiker hoeven na te denken over de fysieke en de logische locatie van een opgeslagen bestand. Een object krijgt een permanente plek op de harde schijf, zodat de applicaties deze eenvoudig kunnen ophalen. CAS slaat elke byte op twee afzonderlijke disks op en bovendien op verschillende hosts, om het uitvallen van een disk te ondervangen. Hierdoor is het niet noodzakelijk om een separate backup-oplossing in te richten, die vanwege de omvang waarschijnlijk onwerkbaar zou zijn in de praktijk. Vanwege het op GUID gebaseerde mechanisme in combinatie met de hierboven vermelde karakteristiek is het evenmin White Paper Media Content Storage 6

7 noodzakelijk om een separate SAN-architectuur in te richten voor de opslag van statische data. De technologie voorkomt tegelijkertijd dat gebruikers enig object tweemaal opslaan en brengt zo de kosten terug die traditioneel voortkomen uit overmatig diskgebruik. Het systeem ziet dat een bestand al aanwezig is. Je kunt aan elk bestand opdrachten meegeven die bepalen wat ermee moet gebeuren na een bepaalde periode. De opdrachten kunnen betrekking hebben op het verwijderen of archiveren van een bestand, hoe vaak CAS het bestand moet wegschrijven en over hoeveel schijven, en zelfs over hoeveel datacenters we de data willen kopiëren. Verder kunnen we steeds exact de benodigde opslagcapaciteit toevoegen zonder onderbreking van de dienstverlening en zonder in te grijpen in de applicatie zelf. Er zijn verschillende leveranciers die op CAS gebaseerde oplossingen aanbieden, waarvan CAStor van Caringo er één is. Een belangrijke eigenschap van dit product is dat we custom metadata aan objecten kunnen meegeven. In de medische wereld bijvoorbeeld gelden jarenlange bewaartermijnen voor bepaalde soorten data. Met CAS behoudt de eigenaar van de data - los van de applicatie waarmee hij de objecten ooit aanmaakte - toegang tot de metadata van het object. White Paper Media Content Storage 7

8 Een ander belangrijk element in de medische wereld is het garanderen van de integriteit van het object. Hoe stellen we zeker dat het opgeslagen bestand niet is gewijzigd of corrupt is geraakt? CAStor zekert de objecten door middel van een hash-algoritme gezekerd en checkt periodiek alle bestanden op integriteit. Zeker met het oog op archivering op de lange termijn is dit een zeer belangrijke vereiste. Achteraf is op deze manier te bewijzen dat het object in het archief authentiek is en ook niet is veranderd. Daar waar verschillende typen bestanden/objecten in één en dezelfde infrastructuur staan opgeslagen, is het van belang dat de infrastructuur verschillende retentieperiodes van bestanden ondersteunt. Zo geldt medische gegevens een zeer lange bewaartermijn, maar geldt voor administratieve info meestal een kortere. Via de Content File Server bepalen we op het niveau van de applicatie, de harde schijf of per individueel bestand de retentieperiode. Bijvoorbeeld: alle objecten die uit de PACs-applicatie komen(ziekenhuis systeem), hebben een retentieperiode van zeventig jaar. Binnen deze periode kunnen de gebruikers de bestanden niet verwijderen. Alles dat van de financiële afdeling komt, heeft een bewaartermijn van zeven jaar. Na zeven jaar kunnen gebruikers de data verwijderen en na tien jaar gooit het systeem de informatie automatisch weg. Snel maatwerk Nadeel van op CAS gebaseerde oplossingen is dat de doorvoersnelheid van data niet erg hoog is. SANs daarentegen zijn geoptimaliseerd voor het verwerken van grote hoeveelheden verkeer tegelijk om wijzigingen in op geslagen bestanden snel door te kunnen voeren. Hier zal dus de afnemer van het product zijn specifieke kennis moeten toepassen om de responstijden van de op CAS gebaseerde oplossing te optimaliseren. Terremark gebruikt het product CAStor als basis onder haar dienst Media Content Storage en heeft een eigen frontend gebouwd, die zorgt dat de gebruiker de content kan ophalen. Zij past haar kennis op het gebied van caching toe om er voor te zorgen dat het aanbieden van content op een snelle en efficiënte manier gebeurt. Een voorbeeld is caching van bestanden naar individuele gebruikers of groepen gebruikers. Op deze manier is het mogelijk bestanden sneller aan te leveren aan groepen eindgebruikers, waardoor de gebruikerservaring White Paper Media Content Storage 8

9 sterk verbetert. De Media Content Storage-dienst heeft haar waarde inmiddels bewezen bij een aantal nationale en internationale klanten. Conclusie Iedereen die te maken heeft met de opslag van grote hoeveelheden data, doet er verstandig aan om zijn opslagstrategie eens goed onder de loep te leggen. Het eindeloos uitbreiden van een SAN of NAS kan namelijk resulteren in sterk oplopende beheerskosten. Een op CAS gebaseerde aanpak, zoals het Media Content Storage-concept van Terremark, heeft zijn waarde in de praktijk al bewezen en verlaagt de kosten voor hardware én beheer substantieel. Bovendien koppelt het de bestanden los van de applicaties, waardoor er bij migraties minder complicaties optreden (zoals verbroken links). White Paper Media Content Storage 9

Storage op instellingsniveau

Storage op instellingsniveau Storage op instellingsniveau Aanbevelingen lange termijn Auteur(s): SURFnet Versie: 1.01 Datum: oktober 2012 Radboudkwartier 273 3511 CK Utrecht Postbus 19035 3501 DA Utrecht 030-2 305 305 admin@surfnet.nl

Nadere informatie

WINDOWS AZURE EN ISV'S

WINDOWS AZURE EN ISV'S WINDOWS AZURE EN ISV'S EEN HANDLEIDING VOOR BESLISSERS DAVID CHAPPELL JULI 2009 GESPONSORD DOOR MICROSOFT CORPORATION INHOUD ISV's en cloud computing... 2 Een kort overzicht van Windows Azure... 3 Technologie...

Nadere informatie

Eenvoud, kracht en snelheid

Eenvoud, kracht en snelheid OpenIMS Open Informatie Management Server versie 6 Eenvoud, kracht en snelheid Document Management Server Whitepaper Open Informatie Management Server www.openims.com 2003 2015 OpenSesame ICT BV www.osict.com

Nadere informatie

White paper: introductie van Cloud Computing

White paper: introductie van Cloud Computing White paper: introductie van Cloud Computing Introductie Cloud computing De explosieve groei van cloud oplossingen en diensten in de afgelopen periode is een situatie die vergelijkbaar is met de meeste

Nadere informatie

Duurzame opslag van data Energiebesparing door duurzame opslag binnen het hoger onderwijs

Duurzame opslag van data Energiebesparing door duurzame opslag binnen het hoger onderwijs Duurzame opslag van data Energiebesparing door duurzame opslag binnen het hoger onderwijs Colofon Duurzame opslag van data Energiebesparing door duurzame opslag binnen het hoger onderwijs Hogeschool van

Nadere informatie

Technology Scout MediaMosa met meerdere content stores

Technology Scout MediaMosa met meerdere content stores Technology Scout MediaMosa met meerdere content stores Versie 1.5 Datum 3 februari 2010 SURFnet/Kennisnet Innovatieprogramma Inhoudsopgave INHOUDSOPGAVE... 2 SAMENVATTING... 4 INLEIDING... 6 STORAGETYPEN

Nadere informatie

Dataopslagbeleid Universiteit Twente

Dataopslagbeleid Universiteit Twente Universitair Informatiemanagement Dataopslagbeleid Universiteit Twente Inhoudsopgave Voorwoord... 2 Inleiding... 3 1. Afbakening... 3 2. Algemeen beleid... 4 3. Instellingssystemen... 5 4. E-mail en gebruikersdata...

Nadere informatie

Ontwerpverslag. Geentronics Enschede, 7 mei 2003. Opdrachtgever: Jan Mulder Scholengemeenschap. Versie 1.15

Ontwerpverslag. Geentronics Enschede, 7 mei 2003. Opdrachtgever: Jan Mulder Scholengemeenschap. Versie 1.15 Ontwerpverslag Ontwerpverslag Geentronics Enschede, 7 mei 2003 Opdrachtgever: Jan Mulder Scholengemeenschap Versie 1.15 Toelichting Bij het ontwerpdocument dat voor u ligt, valt één zeer belangrijke opmerking

Nadere informatie

Works MIGRATIE. naar de cloud (en er weer uit) PRAKTIJK migratie naar Office 365 en Google Apps

Works MIGRATIE. naar de cloud (en er weer uit) PRAKTIJK migratie naar Office 365 en Google Apps Cloud www.cloudworks.nu nummer 5 juni 2011 jaargang 2 Works HET Vakblad over cloud computing MIGRATIE naar de cloud (en er weer uit) PRAKTIJK migratie naar Office 365 en Google Apps IDENTITYMANAGEMENT

Nadere informatie

Novell Open Enterprise Server 2 vs. Windows * Server. Technical white paper WORKGROUP COLLABORATION. Migratie van NetWare : kosten en voordelen

Novell Open Enterprise Server 2 vs. Windows * Server. Technical white paper WORKGROUP COLLABORATION. Migratie van NetWare : kosten en voordelen Technical white paper WORKGROUP COLLABORATION www.novell.com Novell Open Enterprise Server 2 vs. Windows * Server Migratie van NetWare : kosten en voordelen Novell Open Enterprise Server 2 vs. Windows

Nadere informatie

Wereldwijde hoofdkantoren: 5 Speen Street Framingham, MA01701 V.S. P.508.872.8200 F.508.935.4015 www.idc.com

Wereldwijde hoofdkantoren: 5 Speen Street Framingham, MA01701 V.S. P.508.872.8200 F.508.935.4015 www.idc.com WHITE PAPER EMC SourceOne maakt operationele efficiency en information governance met behulp van SharePoint mogelijk Gesponsord door EMC Corporation Laura DuBois Mei 2010 Wereldwijde hoofdkantoren: 5 Speen

Nadere informatie

Whitepaper Productvergelijkingen cloud infrastructuur

Whitepaper Productvergelijkingen cloud infrastructuur Whitepaper Productvergelijkingen cloud infrastructuur Datum : 05-12-2012 Versie : 1.0 Copyright Alle rechten voorbehouden. Niets uit dit document mag worden vermenigvuldigd en/of op andere wijze openbaar

Nadere informatie

Functioneel ontwerp Linux WerkPlek

Functioneel ontwerp Linux WerkPlek Functioneel ontwerp Linux WerkPlek Inleiding Het project Linux WerkPlek (LWP) beoogt voor verschillende doelgroepen een Linux desktop en bijbehorende infrastructuur aan te bieden. Doelstelling daarbij

Nadere informatie

Waarom kiezen voor Cloud Computing?

Waarom kiezen voor Cloud Computing? Waarom kiezen voor Cloud Computing? De grootste verandering in de ICT sinds de opkomst van het internet 1 Een White Paper is een document dat uitgebreide, objectieve en relevante informatie biedt over

Nadere informatie

Business Continuity en Disaster Recovery: High Availability in server & storage omgevingen

Business Continuity en Disaster Recovery: High Availability in server & storage omgevingen Qi ict whitepaper Business Continuity en Disaster Recovery: High Availability in server & storage omgevingen Klantnaam : Qi ict Datum : augustus 2010 Versie : 1.1 Auteur : Qi ict Document : BC en DR: HA

Nadere informatie

Het papier-efficiënte kantoor. Efficiënte toegang tot actieve documenten

Het papier-efficiënte kantoor. Efficiënte toegang tot actieve documenten 2 Het papier-efficiënte kantoor Efficiënte toegang tot actieve documenten DE WEG NAAR EEN PAPIER-EFFICIËNT KANTOOR OVERMATIG PAPIERGEBRUIK Fase Stage 1 1 Uw behoefte: > Beveiliging van uw informatie verbeteren

Nadere informatie

Hosting op maat: de mogelijkheden op een rij Een white paper van RAM Mobile Data. Schrijver: Niels van Peer 21-07-2008

Hosting op maat: de mogelijkheden op een rij Een white paper van RAM Mobile Data. Schrijver: Niels van Peer 21-07-2008 Een white paper van RAM Mobile Data Schrijver: Niels van Peer Inhoudsopgave Totaaloplossingen voor de communicatieketen...3 Maatwerk cruciale factor...3 Drie kritische succesfactoren...4 1 Betrouwbaarheid

Nadere informatie

Data archiving in een digitale wereld

Data archiving in een digitale wereld Data archiving in een digitale wereld Routekaart voor de archivering van gestructureerde gegevens Drs. Jeroen Tegelaar, drs. Peter Kuiters en drs. Jan Geurtsen Data archiving wordt onterecht vaak alleen

Nadere informatie

6/4 SAN, Storage Area Network

6/4 SAN, Storage Area Network 6/4 SAN, Storage Area Network Storage 6/4.1 iscsi en Novell Cluster Services De term high availability is een van de nieuwe buzz-words. Elke zichzelf respecterende organisatie heeft het erover. Toch zie

Nadere informatie

Enabling Mobile. Een whitepaper over het ontsluiten van data en systemen voor gebruik met en door mobiele applicaties

Enabling Mobile. Een whitepaper over het ontsluiten van data en systemen voor gebruik met en door mobiele applicaties Enabling Mobile Een whitepaper over het ontsluiten van data en systemen voor gebruik met en door mobiele applicaties Door Rutger van Iperen Mobile Developer bij AMIS Services Introductie Het gebruik van

Nadere informatie

Software Archivering met Emulatie. Michiel van Dam - 1224239 Jeff van Egmond - 1308041 4 augustus 2010

Software Archivering met Emulatie. Michiel van Dam - 1224239 Jeff van Egmond - 1308041 4 augustus 2010 Software Archivering met Emulatie Michiel van Dam - 1224239 Jeff van Egmond - 1308041 4 augustus 2010 Executive Summary Veel culturele en onderzoeksdata wordt tegenwoordig gearchiveerd. Bij zo n archief

Nadere informatie

Kies uw cloudscenario De transformatie van eigen datacenter naar de cloud

Kies uw cloudscenario De transformatie van eigen datacenter naar de cloud Kies uw cloudscenario De transformatie van eigen datacenter naar de cloud Whitepaper Inhoudsopgave Van eigen datacenter naar de cloud Definitie 3 grote trends en uitdagingen Het antwoord: 3 mogelijke scenario

Nadere informatie

Bestands en schijfencryptie

Bestands en schijfencryptie Bestands en schijfencryptie Een onderzoek naar de toepasbaarheid binnen SURFnet bv. Marya Steenman & Thijs van den Berg 4 juli 2005 Masteropleiding Systeem- en Netwerkbeheer Universiteit van Amsterdam

Nadere informatie

Perfecte bescherming van uw onderneming. De basis van veilig zakendoen. Enterprise-editie

Perfecte bescherming van uw onderneming. De basis van veilig zakendoen. Enterprise-editie Perfecte bescherming van uw onderneming De basis van veilig zakendoen Enterprise-editie Wat kan deze gids voor u betekenen? Gegevensbescherming is een van de grootste uitdagingen waarvoor moderne organisaties

Nadere informatie

HANDLEIDING Digitaal archiveren van afbeeldingen in een fotoarchief. In opdracht van het Nederlands Fotomuseum door Caroline Grijsen Januari 2013

HANDLEIDING Digitaal archiveren van afbeeldingen in een fotoarchief. In opdracht van het Nederlands Fotomuseum door Caroline Grijsen Januari 2013 HANDLEIDING Digitaal archiveren van afbeeldingen in een fotoarchief In opdracht van het Nederlands Fotomuseum door Caroline Grijsen Januari 2013 1. Inleiding 3 2. Overzicht werkwijze en opslag 4 5 3. Mappenstructuur

Nadere informatie

VOOR EN NADELEN VAN DE CLOUD

VOOR EN NADELEN VAN DE CLOUD VOOR EN NADELEN VAN DE CLOUD VOOR EN NADELEN VAN DE CLOUD Cloud storage. Back-up in de cloud. Er zijn verschillende benamingen voor diensten die computergebruikers in staat stellen om hun documenten en

Nadere informatie

Backup en Recovery oplossing voor VMware omgevingen

Backup en Recovery oplossing voor VMware omgevingen Backup en Recovery oplossing voor VMware omgevingen Virtualisatie biedt ondernemingen een nieuwe manier bij de toepassing van een applicatie architectuur. Het maakt een hogere gebruiksgraad van fysieke

Nadere informatie

Monitoring. Voorkomen is beter dan genezen! Kon ik maar in de toekomst kijken!

Monitoring. Voorkomen is beter dan genezen! Kon ik maar in de toekomst kijken! Monitoring ieder bedrijf heeft te maken met IT. IT is tegenwoordig niet meer weg te denken uit de bedrijfsvoering. Binnen het MKB zijn de bedrijven vaak te klein om de benodigde specifieke IT kennis in

Nadere informatie

Virtualiseren met Inter Access

Virtualiseren met Inter Access Virtualiseren met Inter Access Whitepaper 2007 Kees Hoofd Architect Technical Infrastructure Deze whitepaper dient als richtlijn en hulpmiddel voor uw organisatie bij de keuze en de mogelijkheden van virtualisatie.

Nadere informatie