~L~g. for life. Virtuele muis. Offerte. . innovation. Haalbaarheidstudie naar hergebruik browsertechnologie voor effectieve webcrawl ing



Vergelijkbare documenten
e isoverdr chtbee erkhe enni gvoor o e b reo ee veilig ei

Offerte / Gemeente Breda / Versie 2.0

Vertrouwelijk. Projectpla n. Titel: Entity Extraction. Vertrouwelijk

Green-Consultant - info@green-consultant.nl - Tel Triodos Bank NL17TRIO KvK BTW nummer NL B01 1

Projectplan. Informatie arrangementen als app. s-hertogenbosch, 6 december 2011

Eindrapport Elektronische leeromgeving

Vertrouwelijk. Projectplan. Titel: Photo Response Non Uniformity (PRNU) Vertrouwelijk

FlashReader Tekstextractie uit Flashwebsites en beeldmateriaal van het internet

Raamwerk offerte. Voorblad

Functieprofiel: Projectleider Functiecode: 0302

Technologie en Interactie 3.2: software architectuur

Vraag Ondersteuning door Virtuele Experts

Projectvoorstel Gemeente Breda

Voorwaarden uitvoering van de CQI Dialyse

Prijzen RIVOS. RIVOS Prijzen Pagina 1

Voorstel # ECC1501. Voorstel: #ECC info@socialelephant.nl Telefoon: +31(0) Auteur: Nico van der Zaan

Voorblad Inhoudsopgave Inhoud

Extra impuls gemeenten voor afvalpreventie en afvalscheiding huishoudelijk afval

HTML. Media. Hans Roeyen V 3.0

Uiteindelijk kan er, van alle verzamelde gegevens een cd-rom of dvd worden gemaakt. Deze cd-rom kunt u weggeven of verkopen op de reüniedag.

Program overview. Year 2010/2011 Electrical Engineering, Mathematics and Computer Science

Aanbieding dienstverlening en migratie

Handleiding voor vertegenwoordigers van de Staat

Frontend performance meting

PROJECTVOORSTEL PILOT KOPPELVLAKKEN RSGB BEVRAGINGEN NIEUWE STIJL

Zorgberaad Midden Holland T.a.v. Mw. H. Mesland Vest 264 A 2801 TZ Gouda

Vertrouwelijk. Projectplan. Titel: Photo Response Non Uniformity (PRNU) deel 2. Vertrouwelijk

Bijlage H: VAKGEBIED PROJECTMANAGEMENT

Kortom, van visie naar werkelijkheid!

SYSTEEMVEREISTEN TRACK VERZUIM 4

Zoals afgesproken stuur ik u hierbij de offerte voor de Kandidatenwijzer Stadsdeelcommissies.

PIANOo Congres 26 mei 2011 Mr. Pauline Bos tel Pro 10

Croon Procurement Service

iprova Suite Systeemeisen iprova 5 Hosting

1 Deelproject Spraakherkenning: SHoUT Audio Indexering Service

Voorwaarden uitvoering van de CQI Dialyse

Extra impuls gemeenten voor scheiding kunststof verpakkingsafval van huishoudens

Dainamics Webdesign - Contract Onderhoudsabonnement

Aanpak overlast wijkvreemde parkeerders in Den Hoorn

Algemene voorwaarden Dynamic Webservice

Cursus Analyse voor Web Applicaties 1. Webdesign / Web Programmeren Analyse voor web applicaties SDM methode + Basis UML

Prowise Pro Connect 2.0 Technische documentatie

NIS Notarieel Informatie Systeem

Systeemvereisten Track Verzuim

Wij kunnen u een MijnASP terminal aanbieden met de navolgende voordelen:

Titel Voorbeeld Offerte. 1 appalti.nl

Plan van Aanpak. Project: Portfolio Online Jeremy de Jager INHOLLAND

RVOI-2001 Bijlage: MODELCONTRACT + TOELICHTING

Alkmaar, Onderwerp: Aangepaste offerte Houtplein en Dreef betreft Dreef en

Groenlo, 12 september Betreft: offerte extra veiligheidsmaatregelen Nedap stemmachines. Geachte Heer Heida:

Duraserve marketing Systeem Duraserve, oktober 2011


OpenX Hosting. Opties en Alternatieven

In deze algemene voorwaarden worden de hiernavolgende termen in de navolgende betekenis gebruikt,tenzij uitdrukkelijk anders is aangegeven.

Modelovereenkomst. voor. de levering van een Generieke inrichting Digikoppeling adapter

Bouwproces volgens de visie van Veelzijdigbouw

Grafische automatisering vak van de toekomst

Handleiding voor aansluiten op Digilevering

HEEMKUNDE RIPS. Project Initiatie Document. Datum voltooid: Versie: 1.0. Document ID: 1 Bestandsnaam: Project initiatie document

Bijlage 3: Master testplan

Offerte. Inleiding. Projectopdracht

ONTWIKKELVOORSTEL STAPPENPLAN

PROJECT PLAN VOOR DE IMPLEMENTATIE VAN EEN STANDAARD SITE VOOR DE VERENIGING O3D

Project-, Programma- en AdviesCentrum. Resultaten die eruit springen PPAC

Elementair Project Management

Voorbeeld projectplan

Algemene Voorwaarden. Dekker Design Goes ALGEMEEN

VAN USE CASE NAAR TEST CASE ORDINA SMART COMPETENCE CENTER

Algemenevoorwaarden. Winschoten, 30 oktober Inhoudsopgave

Inleiding 1. Opdrachtaanvaarding 2 t/m 7. Planning en uitvoering professionele dienst 8 t/m 12. Dossier 13 t/m 16. Rapportage 17 t/m 20

Bewerk uw eigen Digibordbij boek

Dienstbeschrijving. Efficon Shared Services

Ondernemend. Ruimte voor talent. Onderscheidend. Kwaliteit. Plezier. Betrokken. Pagina 1 van 10

didiclass 2.0 Opdrachtnemer: E-minor projectgroep Noordelijke Hogeschool Leeuwarden Opdrachtgever: Walter Geerts, de open universiteit

Inlichtingenbureau Voortgangsrapportage April Realisatie van het Sectorloket-systeem

Offerte webdesign

JORR CMS Resellers. JORR IT Havenpark JG Zierikzee

Bijlage 1 Opdrachtomschrijving en algemene voorwaarden

BSc. Inner City Construction Processes (Binnenstedelijk Bouwen)

Digitaal Portfolio software Aanbestedende Dienst:

Modelovereenkomst. voor. de levering van een Generieke inrichting Digikoppeling adapter

Projectindiening. demonstratie- en disseminatieproject. duurzame technologieën op vlak van WATER OPROEP 4. Concepten voor efficiënt waterbeheer

Open Source Business Intelligence bij het Inlichtingenbureau

Portal Planning Process

Ysupport Strippenkaart model 2016

IATI is de internationale standaard voor het openbaar beschikbaar maken van projectinformatie in de ontwikkelingssector.

Plan van Aanpak Afstuderen

Dienstbeschrijving DigiAlarm.net

Specifieke voorwaarden 2Value bv

Inhoud! Debriefing pagina 2 t/m 4

Professional services organisaties Altijd en overal grip op uw projecten, van verkoop tot factuur

Offerte website. Taal & Talent, Jorijn Tragter Thomas Hop, PingOnline Offerte vernieuwde website

Kennismanagement. HiP Consulting Carla Bastiaansen

Plan van Aanpak IVS website: Stichting Innovision Solutions Vlietstraat 11 A 4535 HA Terneuzen KvK: Oktober 2012

Rapport over het werkprofiel van Software engineer (sr)

Transcriptie:

. innovation Virtuele muis Haalbaarheidstudie naar hergebruik browsertechnologie voor effectieve webcrawl ing Offerte Deze offerte is uitgebracht aan: NCTV Postbus 16950 2500 BZ Den Haag Klantcontact Naam contactpersoon: Telefoonnummer: E-maiI: ~L~g @~geid~1~ Copyright 2011 TNO Alle rechten voorbehouden. Niets uit deze uitgave mag worden vermenigvuldigd en/of openbaar gemaakt door middel van druk, foto-kopie, microfilm of op welke andere wijze dan ook, zonder voorafgaande toestemming van TNO. Offe,temodel vl.4, kwa, mei2011

innovation Offertenummer 125948 Inhoudsopgave Vlrtuele muis voor NCTV 1 INTRODUCTIE 3 1.1 ACHTERGROND 3 1.2 PROBLEEMSTELLING 3 1.3 DOELSTELLING 4 2 HET AANBOD - OMSCHRIJVING OPDRACHT 4 2.1 RESULTAAT 4 2.2 ACTIVITEITEN 5 2.3 PLANNING 6 2.4 VERANTWOORDELIJKHEDEN OPDRACHTGEVER 7 2.5 GEEN ONDERDEEL VAN DEZE OFFERTE 7 3 PRIJS EN FACTURE RING 7 3.1 PRIJS 7 3.2 FACTURERING 7 4 LEVERINGSVOORWAARDEN 7 4.1 VOORWAARDEN 7 4.2 GELDIGHEID VAN DE OFFERTE 7 4.3 CONTACTPERSONEN 8 4.4 ONDERTEKENING 8 @2011 TNO Pagina2van8

innovation 0ffertenummer~ 125948 Virtuele muis voor NC1V 1 In roductie Wij danken u voor de uitnodiging aan TNO om op het gebied van internettechnologie haar diensten aan t bieden. Deze offerte is gebaseerd op gesprekken tussen van NCTV en van TNO. Daarnaast is deze offerte gebaseerd op resultaten van het project FlashReader. 1.1 Achtergrond Verschillende diensten zoeken of monitoren specifieke websites. Door middel van een crawler worden websites automatisch geïndexeerd en vervolgens wordt op basis van de verkregen informatie vastgesteld of de website relevant is, dan wel of er relevante ontwikkelingen hebben plaats gevonden in een bepaalde periode. De informatie die crawlers verwerken is voornamelijk gebaseerd op de tekst die wordt gescheiden van de HTML. Indien de informatie wordt gepresenteerd in de vorm van een Flash object (SWF) of beeldmateriaal, dan lukt het veelal niet om deze sites automatisch te indexeren. Deze problematiek is onderzocht in het project FlashReader. In dat project zijn verschillende oplossingsrichtingen in kaart gebracht om Flashwebsites te indexeren. Het project concludeerde dat de volgende oplossingsrichting erg kansrijk is. Een virtuele muis wordt ontwikkeld die is gebaseerd op webbrowsertechnologie. Deze muis doorloopt vervolgens de hele website. Deze oplossing is kansrijk, omdat onder andere Adobe zelf ook een dergelijke oplossingsrichting heeft onderzocht, maar stelt deze niet beschikbaar. Naast Flash wordt nog een aantal nieuwe technieken gebruikt, (zoals Figuur 1 presenteert) die gebruik van dynamische maakt content of steeds meer Rich Internet Applications (RIA). Dit maakt de vraag naar een meer creëert generieke virtuele muis, dle een nieuwe vorm van webcrawling kan faciliteren, alleen maar relevanter. De NCTV (opdrachtgever) heeft in het programma genaamd ~ HERKENNING DIGITALE INFORMATIE EN FINGERPRINTINc3 bovenstaande problematiek als relevant onderwerp aangemerkt Deze relevantie wordt tevens herkend door het Intemnet Service Centre van de Belastingdienst Daarnaast is de centrale stakeholder in dit project het IRN (internet recherche netwerk). N1ML PDF 5, ~. StT~rhght Rich Internet Applications JAVA Figuur 1. Technologieën waarop Ricli lnternet Appilcations zijn gebaseerd, deze webpagina s zijn lastig te indexeren. 1.2 Probleemstelling Veel gebruikte crawlers, zoals HTtrack, zijn niet in staat om RiA s te indexeren. Een mogelijke oplossing zou zijn voor iedere RIA een specifieke crawler ontwikkelen, maar dat is erg kostbaar en betekent dat voor iedere update een nieuwe versie ontwikkeld moet worden. Probleem van de bestaande crawlers is dat zij niet door de pagina s kunnen lopen die gebaseerd zijn op deze technologie. Dat betekent bijvoorbeeld dat een website die begint met een Flash filmpje niet geïndexeerd kan worden omdat deze crawlers geen Flash kunnen interpreteren. 2011 TNO Pagir~a 3 van 8

i nnovation Offertenummer: 125948 1.3 Doelstelling Virtuele muis voor NCTV Browsertechnologie wordt steeds meer gebruikt, krijgt steeds meer functionaliteit, en biedt de mogelijkheid om als alternatieve crawler te gaan dienen. Doe! van het project is de haalbaarheid te toetsen van een virtuele muis die is gebaseerd op deze technologie. De belangrijkste onderzoeksvragen die daartoe beantwoord worden zijn: - Kan browsertechnologie gebruikt worden als crawler door voor dit doel een specifieke plugin te ontwikkelen of bestaande plugins, zoals Firebug, te hergebruiken? Wat is een geschikte open source webbrowser? Is deze crawler generiek toepasbaar voor verschillende RIA s en tevens robuust voor updates van deze RIA s? - Kan een virtuele muis een website volledig doorlopen, door alle clickable regions aan te klikken? Geldt dit ook voor de RIA s? - Hoe kan een toestand van een website gedefinieerd worden, zodat de crawler deze pagina niet bij herhaling blijft indexeren? - Wordt daarmee een generieke crawler ontwikkeld die verschillende technologieën als HTML5, Flash en Silverlight kan indexeren? DLIE 0 OS eb heet Internet Figuur 2. Er zijn verschillende punten In de Flash keten, waar de virtuele muis kan aanhaken. Het FlashReader project concludeert dat de webbrowser het meest belovende aanhaakpunt Is. 2 Het aanbod omschrijving opdracht 2.1 Resultaat De resultaten van dit project zijn: - Proof-of-concept van de virtuele muis die getest kan worden en tevens beschikbaar is voor de stakeholders van de NCTV. - Rapportage en presentatie met de bevindingen van het proof-of-concept op basis waarvan de haalbaarheid van de virtuele gebruiker als alternatieve webcrawler getoetst is. 02011 TNO Pagina 4 van 8

innovation Offertenummer: 125948 Virtuele muis voor NCTV Dit resultaat stelt de stakeholders van de NCTV in staat te besluiten of uitontwikkeling van deze oplossing zinvol is en hoe deze oplossing praktisch gebruikt kan gaan worden. Het eindrapport is voor intern gebruik en door stakeholders van NCTV. Voor elk ander gebruik is voorafgaande toestemming van TNO benodigd. 2.2 Activiteiten Om tot het bovenstaande resultaat te komen, omvat het project de volgende activiteiten: Al. Deskresearch A2. Ontwerpen van een prototype A3. Ontwikkeling proof-of-concept A4. Kwalitatieve test proof-of-concept A5. Rapportage schrijven en resultaten presenteren A6. Projectmanagement Al. Deskrosearch Om vast te stellen welke functionaliteit van de webbrowser precies gebruikt kan worden, wordt door middel van deskresearch een inventarisatie gemaakt van de mogelijkheden die de verschillende browsers te bieden hebben. Resultaat van deze inventarisatie is de keuze voor de browser die het meest geschikt is voor het doel van de virtuele muis. Er wordt vanuit gegaan dat dit een open source webbrowser is, omdat daarvoor relatief eenvoudig technologie ontwikkeld kan worden. Naast de browser zelf is het ook belangrijk inzichtelijk te maken wat relevante bestaande plugins zijn en hoe die gebruikt kunnen worden. Hierbij kan gedacht worden aan een plugin als Firebug voor de open source webbrowser Firefox. A2. Ontwerpen van een prototype Op basis van de mogelijkheden die geïdentificeerd zijn binnen de geselecteerde webbrowser wordt een functioneel ontwerp gemaakt van de virtuele muis. Om de haalbaarheid van het ontworpen prototype te toetsen wordt als proof-of-concept alleen de essentiële componenten ontwikkeld, zodat de virtuele muis getest kan worden. A3. Ontwikkeling proof-of-concept Om de haalbaarheid te toetsen wordt het proof-of-concept ontwikkeld. Dit zal gebeuren in samenwerking met expertise uit de open source community. De inzet van deze expertise is een projectrisico. Dit risico wordt beheerd, doordat deze inzet in het algemene kleine bedragen betreffen (maximaa, wat inhoudt dat een dergelijk experiment ook kan mislukken en nogmaals uitgevoerd kan worden. e bevindingen, over de inzet van de open source community, vormen ook resultaat van dit project. De integratie van deze componenten tot het proof-of-concept wordt door TNO uitgevoerd. A4. Kwalitatieve test proof-of-concept Door middel van een kwalitatieve test van het proof-of-concept wordt de praktische potentie van de virtuele gebruiker getoetst. Dit wordt bereikt door een aantal websites enkele weken te volgen. Daarnaast wordt een vergelijking gemaakt tussen het aantal kilobytes en files die een traditionele crawler kan verzamelen en de hoeveelheid materiaal die deze nieuwe crawler kan verzamelen, Dit levert een indicatie op van de winst van deze nieuwe benadering. A5. Rapportage schrijven en resultaten presenteren Om de bevindingen van dit project goed te delen met stakeholders en derden worden alle relevante bevindingen gepresenteerd in de vorm van een rapportage. Daarnaast worden de resultaten gedeeld door middel van een presentatie voor stakeholders van de NCTV. A6. Projectmanagement Benodigd projectmanagement voor het realiseren van het projectresultaat, afstemming met NCTV afstemming met stakeholders en Organisatie omtrent presentatie van de projectresultaten. 2011 TNO Pagina 5 van 8

innovation Offertenummer: 125948 Virtuele muis voor NCTV 2.3 Planning Tabel 1 presenteert de doorlooptijden van het haalbaarheidsonderzoek. Tabel 1. Doorlooptljd per activiteit Al A2 A3 A4 A5 A6 Totaal -- 4 weken 4 weken 12 weken 8 weken 25 weken 30 weken 30 weken Voor de totale projectuftvoerlng is een doorlooptijd begroot van 30 weken zoals de projectplanning in Tabel 2 laat zien. Tabel 2. ProJectplannlng 1 2 3 4 5 6 7 8 9 1011 12131415161718192021 222324252827282930 d (J Ontwerp delen met stakeholcier Afstemming met stakeholder over uit te voeren testen Presentatie uitkomsten haalbaarheid Projectoverleg met Projectafronding De werkzaamheden kunnen starten in oktober 2011, maar pas nadat wij uw schriftelijke opdracht hebben ontvangen. De projectorganisatie ziet er als volgt uit. De beoogd projectleider is _f~ TNO is de uitvoerder van de activiteiten Al tot en met A6. Activiteit A3 zal gedeeltelijk uitgevoerd worden door extemen uit de open source community. De participerende stakeholder is lid van het projectteam door ervanng in te brengen, en anderzijds het beoordelen van de bruikbaarhejd van het behaalde resultaat in activiteit A5. Na afronding van het project zal acceptatie worden gevraagd middels het TNO Protocol van Oplevering 02011 TNO Pagina 6 van S

1 nnovation Offertenummer 125948 VMueIe muis voor NCTV 2.4 Verantwoordelijkheden opdrachtgever De opdrachtgever js verantwoordelijk voor de organisatie van het disseminatie proces. Dit betreft afstemming over de invulling, locatie en de uit te nodigen stakeholders voor de presentatie van de resultaten. Daarnaast is de opdrachtgever verantwoordelijk voor de selectie van de relevante stakeholders om de eindrapportage mee te delen. 2.5 Geen onderdeel van deze offerte De offerte voorziet niet in: Oplevering van productie software Documentatie en support bij proof-of-concept software Organisatie van disseminatie proces 3 Prijs en facturering 3.1 Prijs De prijs van de werkzaamheden zal worden gebaseerd op de werkelijk bestede uren en de werkelijk gemaakte materiële kosten. De richtpr)js bedraagt L exclusief BTW, prijspeil 2011. Het bedrag zal alleen na toestemming vooraf door de opdrachtgever worden overschreden. Bij 70% benutting van de rtchtprijs zal er overleg met de opdrachtgever plaatsvinden over de afronding (wat nog te doen, tegen welke kosten). Afhankelijk van de wensen van de opdrachtgever kan er een nieuwe richtprijs worden bepaald. Voor inhuur van expertise uit de open source communfty is exclusief BTW begroot 3.2 Facturering De werkzaamheden zullen maandelijks in rekening worden gebracht op basis van de werkelijk gemaakte uren en kosten. Betalingscondities: binnen 30 dagen na factuurdatum onder vermelding van het factuumummer. 4 Leveringsvoorwaarden 4.1 Voorwaarden Op deze offerte is het NCTb-TNO protocol van toepassing. Zie hiervoor het schrijven van NCTb van 11 juli 2008 met kenmerk 5555228/08. Indien de NCTV wordt verzocht (in het kader van een WOB verzoek) het eindrapport of andere documenten van belang voor dit project te publiceren, zal de NCTV alvorens tot publicatie over te gaan TNO in de gelegenheid stellen de betreffende documenten te reviewen. Reviewen houdt in dat TNO eigennamen en commercieel vertrouwelijke gegevens onleesbaar maakt 4.2 Geldigheid van de offerte De offerte is geldig tot 19 oktober 2011. 02011 TNO Pagina 7 van 8

innovation Offerten ummer: 125948 Virtuele muis voor NOW 4.3 w. W~ i ~w. ~W.. Wij verzoeken u vriendelijk om vragen over deze offerte te richten aan de volgende personen: Commercieel contactpersoon InhoudelIjk contactpersoon 4.4 Ondertekening Wij danken u voor het in ons gestelde vertrouwen en zien graag uw opdrachtbevestiging of een ondertekend exemplaar van deze offerte tegemoet, ter attentie van TNO, Ir. A.C. van Tol, postbus 96864, 2509 JG Den Haag. Voor NCTV (voor accedtatle) /~ /~1 Naam Voor TNO (offerte) Naam Is Functie. Functie Datum en plaats Datum en plaats ~i9~% % 24_Lj.. (s ~ L1 J~44.% 2~tj 2011 TNO Pagina 8 van 8