FlashReader Tekstextractie uit Flashwebsites en beeldmateriaal van het internet

Maat: px
Weergave met pagina beginnen:

Download "FlashReader Tekstextractie uit Flashwebsites en beeldmateriaal van het internet"

Transcriptie

1 TNO-rapport FlashReader Tekstextractie uit Flashwebsites en beeldmateriaal van het internet Technical Sciences Brassersplein CT Delft Postbus GB Delft T F infodesk@tno.nl Datum 8 september 2011 Auteurs TNO Aantal pagina's 34 Opdrachtgever Ministerie van Veiligheid en Justitie / NCTV Projectnaam FlashReader & OCR voor OOV Projectnummer Alle rechten voorbehouden. Niets uit deze uitgave mag worden vermenigvuldigd en/of openbaar gemaakt door middel van druk, foto-kopie, microfilm of op welke andere wijze dan ook, zonder voorafgaande toestemming van TNO. Indien dit rapport in opdracht werd uitgebracht, wordt voor de rechten en verplichtingen van opdrachtgever en opdrachtnemer verwezen naar de Algemene Voorwaarden voor opdrachten aan TNO, dan wel de betreffende terzake tussen de partijen gesloten overeenkomst. Het ter inzage geven van het TNO-rapport aan direct belang-hebbenden is toegestaan TNO

2 TNO-rapport 2 / 34 Managementsamenvatting Dit rapport presenteert de onderzoeksresultaten die voortvloeien uit het project FlashReader dat onderdeel is van het programma "Herkenning digitale informatie en fingerprinting" van de NCTV. Dit programma richt zich op de herkenning van relevante informatie in digitale bronnen. Een van de belangrijkste informatiebronnen voor maatschappelijke veiligheidsdoeleinden is het internet. Om zoveel mogelijk informatie van het internet te verkrijgen moet zoveel mogelijk tekst uit websites kunnen worden verkregen. In het geval van standaard websites is dat geen enkel probleem, maar zodra tekst is gevat in een Flash website of in beeldmateriaal, dan wordt het automatisch extraheren van tekst een stuk gecompliceerder. Dit rapport presenteert een inventarisatie van oplossingen en oplossingsrichtingen om deze tekst te uit het bronmateriaal te kunnen extraheren. De belangrijkste resultaten betreffen: Flash websites en tekst in beeldmateriaal zijn twee voorbeelden om tekstuele content te presenteren, waarvoor tekstextractie lastig is. Andere gecompliceerde voorbeelden zijn HTML5, Ajax of Java gebaseerde websites. Het aantal websites dat gebaseerd is op deze technologieën groeit, waardoor het extraheren van tekst voor steeds meer websites een probleem wordt. Een virtuele gebruiker die automatisch alle klikbare elementen aanklikt in een website die gebaseerd kan zijn op de verschillende technieken is een essentieel onderdeel om meer tekstuele informatie van websites te verkrijgen. Vervolgens is de vraag op welke wijze een website volledig is te indexeren. Deze virtuele gebruiker moet er uiteindelijk voor zorgen, dat zoveel mogelijk elementen van een website worden gedownload. Dit rapport concludeert dat een virtuele gebruiker die gebaseerd is op browsertechnologie de meest belovende benadering is. De virtuele gebruiker moet alle content downloaden, zodat vervolgens ieder element op eigen wijze kan worden verwerkt om tekst te extraheren. Voor HTML is dit proces bekend, voor Flash componenten kan de statische informatie eenvoudig verkregen worden door het Flash object te decompileren en in het geval van beeldmateriaal met tekst kan deze door middel van OCR worden verkregen. Het OCR onderzoek laat zien dat dit niet triviaal is. Tekst in beeldmateriaal kan goed herkend worden met bestaande OCR technologie als de tekst kenmerken heeft van een traditioneel tekst document. Dit betreft: computer lettertype, donkere tekst tegen een lichte achtergrond, horizontale oriëntatie van de regels en de karakters moeten voldoende resolutie hebben. Door middel van beeldverbetering kan de herkenningskwaliteit enorm toenemen. Dit rapport heeft laten zien dat veel tekst in beeldmateriaal op het internet te weinig resolutie heeft voor goede herkenning. Experimenten hebben laten zien dat opschalen van het beeldmateriaal met een factor 2 de herkenningskwaliteit kan doen verbeteren van 0% naar 100% correcte resultaten.

3 TNO-rapport 3 / 34 Inhoudsopgave Managementsamenvatting Inleiding Flash objecten en Flash gebruik Achtergrond van SWF Statische en dynamische (tekstuele) content Flash gebruik Conclusies Oplossingen voor tekstextractie uit SWF objecten Bestaande oplossingen Virtual user geautomatiseerd een website verkennen Virtual user tekst extractie Conclusies met betrekking tot de oplossingsrichtingen Tekst in afbeeldingen op het internet Inventarisatie van tekst in afbeeldingen op het internet Contactinformatie in beeldmateriaal Conclusies Tekstextractie met OCR technologie Introductie OCR technologie OCR technologie toegepast op de use-cases Beeldverbetering voor optimaal OCR resultaat Relevante instellingen in de OCR software TNO research tooling Conclusies Tesseract of FineReader Kwalitatieve vergelijking op basis van de use-case marktplaats Vergelijking op basis van lettertype en lettergrootte voor de use-case B Conclusies en Uitdagingen Conclusies... 34

4 TNO-rapport 4 / 34 1 Inleiding Dat het Internet een zodanig gigantische omvang zou krijgen had eind jaren tachtig van de vorige eeuw waarschijnlijk niemand durven te voorspellen. Vandaag de dag zijn er wereldwijd meer dan 2 miljard mensen met toegang tot het internet. Het is daarom niet verbazingwekkend dat steeds meer mensen online activiteiten ontplooien. Helaas is een deel van deze activiteiten strafbaar. Internet recherche is erop gericht om strafbare activiteiten op het internet te identificeren en aan te pakken. Het is een relatief nieuwe vorm van recherche die binnen Nederland wordt uitgevoerd door enkele overheidsdiensten. Een belangrijke activiteit bij internet recherche is het onderzoeken en selecteren van websites die mogelijk in strijd zijn met de wet, of blijk geven van mogelijke strafbare feiten. Omdat het aantal websites dat bekeken moet worden gigantisch is, is het efficiënt om dit proces te automatiseren. Hiertoe worden vaak crawlers ingezet. Crawlers bezoeken op een systematische manier een website, bepalen alle links op de pagina en bezoeken vervolgens alle pagina s waar naar verwezen wordt. Van elke bezochte pagina wordt de broncode geanalyseerd en eventueel opgeslagen. Tijdens de analyse van de broncode wordt de weergegeven tekst van de opmaak en programmacode gescheiden. De verkregen informatie wordt bijvoorbeeld gebruikt om website te classificeren als relevant voor een bepaalde case, zoals Figuur 1 illustreert. WWW WWW WWW WWW internet WWW WWW WWW WWW WWW WWW WWW WWW Of handmatige identificatie van relevante websites (= duur) automatische identificatie van relevante websites WWW Slim filter WWW automatische monitoring van veranderingen Figuur 1. Internet recherche richt zich op het identificeren en monitoren van relevante websites (de rode www s). Het scheiden van de weergegeven tekst, ook wel parsen genoemd, is bij kale HTML pagina s relatief eenvoudig. De opkomst van nieuwe technieken als AJAX, Flash en Silverlight zorgt ervoor dat steeds minder pagina s door crawlers kunnen worden geparsed, waardoor de relevante informatie niet uit de pagina s kan worden geëxtraheerd. We onderscheiden drie klassen van objecten waar crawlers niet zondermeer informatie uit kunnen extraheren: HTML5 1 / AJAX pagina s dit zijn HTML pagina s die veel gebruik maken van JavaScript 2 en dynamisch content laden en weergeven. Rich Internet Applications 3 (RIA s) dit zijn webapplicaties die veelal in de browser draaien met behulp van een speciale plugin. Voorbeelden zijn Adobe Flash 4, JavaFX 5 en Microsoft Silverlight

5 TNO-rapport 5 / 34 Audiovisueel materiaal dit zijn objecten zoals afbeeldingen, audio en video waarin de informatie niet tekstueel gerepresenteerd is. Figuur 2. Website bezoekers zien teksten anders dan computers. Het extraheren van informatie uit een pagina die veel gebruik maakt van JavaScript is lastig omdat de weergegeven informatie veelal niet aanwezig is in de broncode. In plaats daarvan wordt de informatie ingeladen op het moment dat de gebruiker de pagina bekijkt of ermee interacteert. Hetzelfde geldt voor Rich Internet Applications zoals Flash. Deze RIA s hebben bovendien vaak een bestandsformaat dat niet tekstueel maar binair is waardoor zelfs de programmacode niet door de crawler te lezen is. De laatste klasse van objecten is slecht leesbaar voor crawlers omdat de tekst bijvoorbeeld is vastgelegd in pixels in plaats van door de computer leesbare karakters, zoals Figuur 2 laat zien. Het doel van dit onderzoek is te onderzoeken of met nieuwe technologie deze websites wel of gedeeltelijk geïndexeerd kunnen worden. Een groot aantal verschillende oplossingsrichtingen is mogelijk. Om enige richting te houden is gefocust op een aantal use-cases. De onderzoeksresultaten worden gepresenteerd aan de hand van zes onderzochte cases, waar bij iedere case een onderzoeksvraag centraal stond. Deze onderzoeksvragen betroffen: 1. Hoe wordt Flash gebruikt op een aantal Nederlandse internetpagina s? 2. Wat zijn verschillende oplossingsrichtingen om een SWF object te indexeren? 3. Hoe wordt tekst gebruikt in beeldmateriaal op het internet? 4. Hoe kan tekst uit afbeeldingen geëxtraheerd worden met OCR technologie? 5. Wat is het verschil tussen Tesseract of FineReader, dus tussen open source of commerciële software?

6 TNO-rapport 6 / 34 2 Flash objecten en Flash gebruik Dit hoofdstuk geeft inzicht in de wijze waarop Flash objecten gemaakt worden en hoe deze gebruikt worden op het internet. Daartoe zijn twee cases onderzocht: auto websites en webshops. Deze verkregen inzichten maken het belang duidelijk van het extraheren van tekst uit Flash objecten. 2.1 Achtergrond van SWF Een SWF object is een bestand dat is bedoeld om op een zo compact (qua aantal bytes) mogelijke manier afbeeldingen, tekst, audio, video en animaties over het internet bij een gebruiker te krijgen. SWF bestanden zijn niet bedoeld om dit type content uit te wisselen tussen de makers ervan. Een SWF bestand wordt afgespeeld met behulp van de Adobe Flash Player of Adobe AIR software. Deze software kan gratis worden gedownload en gebruikt. De Adobe Flash Player is beschikbaar als stand-alone applicatie en als plugin voor alle gangbare webbrowsers. Adobe Integrated Runtime (AIR) is een platform onafhankelijke runtime environment primair bedoeld voor het uitvoeren van AIR applicaties. AIR applicaties zijn desktop applicaties die geïnstalleerd moeten worden, voordat ze gebruikt kunnen worden. Met AIR kunnen ook SWF objecten worden uitgevoerd. Figuur 3: Verschillende manieren om SWF en AIR applicaties te creëren en uit te voeren Er zijn verschillende manieren om SWF (en ook AIR) objecten te creëren. De twee meest gangbare applicaties die worden gebruikt voor het maken van Flash animaties en applicaties zijn Adobe Flash en Adobe Flex Builder (tegenwoordig Adobe Flash Builder genaamd). Adobe Flash wordt vooral gebruikt om Flash animaties te creëren en Adobe Flash Builder is beter geschikt om webapplicaties en cross-platform desktop applicaties te ontwikkelen. De wijze waarop het eindresultaat tot stand komt is heel verschillend. Met Flash Builder wordt de applicatie grotendeels geprogrammeerd, terwijl met Flash de animatie vooral wordt getekend en geanimeerd op een tijdslijn. Flash Builder maakt gebruik van Adobe s Flex SDK, een software development kit om met behulp van ActionScript en MXML

7 TNO-rapport 7 / 34 Flash applicaties te bouwen. Deze SDK is in 2008 door Adobe vrijgegeven in de open-source community. Onderdeel van de SDK is een compiler waarmee SWF objecten gecompileerd kunnen worden. De broncode van deze compiler is dus vrij beschikbaar 7. Het beeld dat ontstaat op basis van onze inventarisatie is dat het aantal internet applicaties gebaseerd op Flex steigt, maar nog altijd verreweg het meerendeel van de SWF objecten is gebaseerd op Flash. 2.2 Statische en dynamische (tekstuele) content De informatie die wordt weergegeven door de Flash Player wanneer een SWF object wordt uitgevoerd is veelal een combinatie van statische en dynamische informatie. Statische informatie wordt aan een grafisch element zoals een tekstveld of button toegevoegd op het moment dat het Flashobject wordt gecreëerd (compiletime). Dynamische informatie is informatie die van buiten het Flashobject komt en wordt geladen en weergegeven op het moment dat het object wordt afgespeeld of naar aanleiding van een actie van een gebruiker (run-time). Deze informatie kan bestaan uit tekst, maar ook uit afbeeldingen of audiovisueel materiaal. Wanneer de informatie die door het SWF object moet worden weergegeven regelmatig veranderd, zoals bij het aanbod van artikelen in een webshop het geval is, dan wordt er veelal voor gekozen deze informatie dynamisch te maken. In dat geval leest het Flashobject de informatie veelal uit een database. Een andere reden om informatie dynamisch te downloaden is om de grootte van het SWF object in de hand te houden. Als bijvoorbeeld een grote hoeveelheid beeldmateriaal meegenomen moet worden, dan zorgt dat voor een groot SWF object, dat minder plezierig in gebruik is. Deze externe informatiebronnen zijn erg relevant en is het belangrijk om deze informatie te kunnen ontsluiten. 2.3 Flash gebruik Flash is een veel gebruikte techniek op het Internet. Meer dan 98% van de op het internet aangesloten desktop computers heeft een Flash Player geïnstalleerd. Daarnaast zijn meer dan 800 miljoen mobiele apparaten in staat om Flash af te spelen 8. Om, zonder naar volledige representativiteit te streven, een indruk te krijgen van het gebruik van deze technologie, heeft TNO onderzocht hoe vaak Flash gebruikt wordt op websites van autohandelaren en webshops. Daarnaast is onderzocht om welk type SWF objecten het gaat en welke technologie is gebruikt om de SWF objecten te creëren. Omdat ook vaak standaard (open-source) Flash objecten en bibliotheken (libraries) worden gebruikt zijn deze ook meegenomen in de inventarisatie. Om inzichtelijk te maken hoe het Flash landschap eruit ziet zijn voor twee type websites: autohandelaren (4062 websites) en webwinkels (1052 websites), een groot aantal sites geanalyseerd en zijn alle Flashobjecten gedownload. Deze objecten zijn stuk voor stuk beoordeeld tot welke categorie dit Flash object behoord en of het object een standaard component betrof of gebruik maakt van bepaalde bibliotheken. Er is onderscheid gemaakt in de volgende 9 categorieën:

8 TNO-rapport 8 / Banner Een Flash animatie waarin iets wordt aangeprijsd. Bevat vaak een soort logische verhaallijn. 2. Header Een geanimeerde kop voor de website 3. Intro Een animatie die de gebruiker verwelkomt en vervolgens doorstuurt naar de website 4. Movie / -player Een Flash object dat een (streaming) video laat zien of bevat 5. Navigation Een geanimeerd object dat wordt gebruikt om de gebruiker door de website te laten navigeren 6. Site Een volledig in Flash gemaakte (veelal schermvullende) website 7. Slideshow / gallery / scroller Een object dat achtereenvolgens (al dan niet dynamisch geladen) foto s en afbeeldingen toont 8. Anders Een Flash object dat niet in een van de hierboven genoemde categorieën valt, bijvoorbeeld een digitaal formulier of een countdown timer 9. Onbekend Een flash object waarvan niet kon worden vastgesteld in welke van de hierboven genoemde categorieën het valt, omdat het bijvoorbeeld een error bevatte en niet kon worden afgespeeld Case: autohandelaren Verschillende websites faciliteren de aankoop en verkoop van nieuwe en gebruikte auto s. Een dergelijke website geeft overzicht van een groot aantal autobedrijven met links naar hun website. In april 2011 telde dit overzicht 4062 autobedrijven. Met behulp van de website copier HTTrack 9 zijn de Flash objecten op de websites van al deze bedrijven opgeslagen. Hierbij zijn alleen de SWF objecten op de homepage meegenomen. Dit resulteerde in een totaal van 1221 bestanden. Uit Tabel 1 blijkt dat het grootste deel van de SWF objecten op de homepages van de bezochte autobedrijven uit slideshows bestaat. Veel garagebedrijven geven hun bezoekers graag een indruk van het uitgebreide assortiment door foto s in een slideshow te tonen. Ook headers worden veel gebruikt om mooie afbeeldingen van auto s te presenteren. Uit de inventarisatie blijkt dat 2,5% van de Flash objecten een volledige Flash website betreft. Dit houdt in dat 14 van de 4062 (0.3%) autobedrijven een website heeft die volledig in Flash gemaakt is. Tabel 1: Categorisatie SWF objecten op websites autobedrijven Type Aantal Percentage Banner 64 11,3 Header ,6 Intro 48 8,5 Movie / -player 14 2,5 Navigation 96 16,9 Site 14 2,5 Slideshow / gallery / scroller ,8 Anders 37 6,5 Onbekend 59 10,4 Totaal

9 TNO-rapport 9 / Case: webshops Een tweede case die is onderzocht betreffen de webshops. Thuiswinkel.org behartigt de belangen van webshop eigenaren en heeft als een van haar doelen het vertrouwen in kopen op afstand te vergroten. Op de website van Thuiswinkel.org staat een overzicht van alle in totaal 1221 leden (in april 2011). Met behulp van HTTrack zijn de Flash objecten op de homepages van alle leden opgeslagen. Dit resulteerde in een totaal van 197 SWF bestanden. Deze bestanden zijn vervolgens handmatig geclassificeerd op basis van bron (Flex of Flash) en het type animatie. Tabel 2: Categorisatie SWF objecten van webshops Type Aantal Percentage Banner 39 19,8 Header 32 16,2 Intro 1 0,5 Movie / -player 3 1,5 Navigation 48 24,4 Site 0 0 Slideshow / gallery / scroller 29 14,7 Anders 11 5,6 Onbekend 34 17,3 Totaal Tabel 2 laat zien dat op de websites van de onderzochte webshops vooral Flash wordt gebruikt voor navigatie en banners. Ook headers en slideshows komen veel voor. Het is opvallend dat er geen enkele webshop volledig in Flash gemaakt is, ondanks dat Flash zich daar uitstekend voor leent Standaard componenten Sommige functionaliteit, zoals het weergeven van een slideshow of het aftellen tot een bepaalde datum, is vrij generiek. Het Flashobject dat nodig is om de computer een set aan foto s te laten presenteren is onafhankelijk van de foto s die moeten worden weergegeven. Er zijn verschillende partijen die voor dergelijke doeleinden standaard componenten ontwikkelen en deze (gratis) aanbieden. Door het instellen van een paar parameters zijn deze componenten aan te passen op de website waarop ze gebruikt worden, zoals Figuur 4 laat zien. <embed src="imagerotator.swf" width="470" height="160" allowscriptaccess="always" allowfullscreen="true" flashvars="file=imagerotator.xml&transition=blocks" /> Figuur 4. HTML code voor het embedden van een standaard component

10 TNO-rapport 10 / 34 Het is goed mogelijk om de informatie uit dergelijke objecten te halen, omdat exact bekend is hoe het object in elkaar zit. Het slideshow component Cu3er heeft bijvoorbeeld een parameter xml_location welke als waarde de locatie van het configuratie bestand krijgt. In dit configuratie bestand staan de adressen van alle weergegeven foto s. a. b. c. d. e. f. Figuur 5. Standaard componenten die veel gebruikt worden: a. Loader [ref]; Slide of image shows: b. DigRotate; c. Image Slider; d. Mono SlideShow; e. JW Image Rotator; f. JSN ImageShow. Uit de casestudies blijkt dat de volgende standaard componenten regelmatig worden gebruikt (zie ook Figuur 5): Digrotate Cu3er ImageRotator ImageShow Loader Mono Slideshow Bz Animation Odo Counter 2.4 Conclusies Het feit dat 2,5% van de SWF objecten van autohandelaren een volledige website betreft is al significant. Daarnaast heeft 8,5% van deze bedrijven een Flashanimatie, voordat de site geopend wordt. Een crawler moet voorbij deze objecten, voordat de site daadwerkelijk geopend kan worden. Naast het gebruik van Flash is het belangrijk op te merken dat andere technologieën, zoals HTML5 en Silverlight groeien als middel om rich internet applications te ontwikkelen. Evenals voor Flash websites zijn deze op dit moment slecht te indexeren.

11 TNO-rapport 11 / 34 3 Oplossingen voor tekstextractie uit SWF objecten Dit hoofdstuk presenteert verschillende oplossingsrichtingen voor de extractie van tekst uit een SWF object. Deze richtingen zijn gebaseerd op een aantal experimenten die zijn uitgevoerd door TNO en een workshop georganiseerd door PSIC 10. Tijdens deze workshop zijn verschillende oplossingsrichtingen in kaart gebracht. De oplossingsrichtingen kunnen aangrijpen op verschillende systeem-, programma- of procesniveaus die bij het afspelen van een SWF object betrokken zijn, zoals het operating system, de webbrowser, de SWF player, het SWF object of verschillende mee te compileren componenten. Figuur 6 presenteert de geneste structuur van deze verschillende niveaus. Componenten SWF object SWF player Webbrowser OS Client Figuur 6. Verschillende oplossingsrichtingen kunnen op verschillende niveaus ingrijpen of aanhaken. Dit hoofdstuk is als volgt georganiseerd. Eerst worden twee bestaande concepten gepresenteerd die een mogelijke oplossing zijn voor het extraheren van informatie uit SWF objecten. Deze oplossingen hebben echter verschillende beperkingen, waardoor alternatieve oplossingsrichtingen worden gepresenteerd voor een virtuele gebruiker die een volledige website bezoekt en vervolgens de tekst extraheert. 3.1 Bestaande oplossingen Er zijn twee oplossingsrichtingen die relevant zijn benoemen op dit punt. De methode die Google hanteert voor het indexeren van SWF objecten en Adobe Wallaby, een tool om Flash om te zetten naar HTML5 wordt toegelicht Adobe s headless Flash player Voor veel eigenaren van websites is het bijzonder belangrijk dat gebruikers hun website kunnen vinden via de gangbare zoekmachines. Het werd dan ook als een nadeel van Flash applicaties gezien dat ze niet konden worden geïndexeerd. Voor Adobe was het belangrijk om dit probleem te verhelpen en ze hebben daarom in samenwerking met Google aan een oplossing gewerkt. In 2008 kondigde Google aan dat het nu in staat is om bepaalde Flash websites te indexeren. Met behulp van 10 PSIC -

12 TNO-rapport 12 / 34 een headless Flash player, een Flash player zonder grafische output, worden SWF objecten uitgevoerd alsof er een gebruiker mee interacteert. Alle tekst die normaal gesproken op het scherm zou worden getoond wordt opgeslagen en geïndexeerd. Noch Adobe, noch Google heeft echter de headless Flash player beschikbaar gesteld aan derden en over de precieze werking van de player is weinig informatie te vinden. Het is daarom onduidelijk welke informatie de player wel en niet uit SWF objecten kan extraheren. Zeker is wel dat Google niet in staat is om alle Flash websites vindbaar te maken. Deze benadering biedt gedeeltelijk een oplossing, waarbij het idee om vanuit de SWF player tekst te extraheren zeer interessant is Adobe Wallaby De laatste jaren is het gebruik van smart phones en andere mobiele apparaten zoals tablet computers enorm toegenomen. Deze apparaten hebben allemaal toegang tot het internet, maar bieden niet allemaal ondersteuning voor Flash. De bekendste voorbeelden hiervan zijn de iphone, ipad en ipod Touch van Apple. Daarnaast is er een trend naar het gebruik van open formaten, terwijl Flash grotendeels een gesloten formaat is. Dit leidt ertoe dat alternatieven voor Flash steeds populairder worden. Eén van de belangrijkste alternatieven is HTML5, een W3C standaard voor het structureren en presenteren van webcontent. Adobe speelt op deze trend in door ondersteuning voor HTML5 in haar producten aan te bieden. Daarnaast werkt Adobe aan een Flash naar HTML5 converter, waarvan de eerste experimentele versie op 8 maart 2011 is vrijgegeven onder de naam Wallaby. Wallaby biedt alleen (gedeeltelijke) ondersteuning voor Flash CS5 bestanden. Zoals Duda et. al. 11 al in 2008 beschreven is het crawlen en indexeren van web 2.0 websites die veel gebruik maken van AJAX en Javascript technologie helaas ook niet triviaal. Bovendien kan Wallaby alleen Flash bronbestanden omzetten naar HTML5 en geen SWF objecten. Dit betekent dat het SWF object eerst geconverteerd moet worden naar Flash. Kortom, deze oplossingsrichting behoud de problematiek van het indexeren, dan dat het een oplossing biedt. Het maakt ook duidelijk dat het niet alleen Flash of SWF is waar de tekstextractie problemen voor aan de orde zijn. 3.2 Virtual user geautomatiseerd een website verkennen Om SWF objecten goed te ontsluiten is het van belang zoveel mogelijk tekst te extraheren uit deze websites. Dit is niet triviaal, maar niet onmogelijk. Een normale crawler, zoals HTTrack, doorloopt een volledige website door alle links te volgen. Dit is een vrij technische aanpak om het gedrag van een gebruiker te simuleren die alle pagina s van een website bezoekt. Om een SWF object te indexeren moeten zoveel mogelijk pagina s bezocht worden, maar in dit geval zijn niet alle links beschikbaar zoals in een normale HTML pagina. Om dit doel te realiseren moet de virtuele user verschillende pagina s kunnen vinden. Dit vereist kennis over de posities van de verschillende links waarbij een klik leidt naar een andere pagina. Vervolgens is het essentieel te weten of een 11 AJAXSearch: Crawling, Indexing and Searching Web 2.0 Applications, Cristian Duda, Gianny Frey, Donald Kossmann and Chong Zhou, In Proceedings of the VLDB Endowment 1, 2 (August 2008)

13 TNO-rapport 13 / 34 pagina al bezocht is, zodat alle pagina s worden bezocht en het aantal dubbelen beperkt wordt. Dit is het tweede belangrijke aspect naast het herkennen van klikbare gebieden. Om vast te stellen dat een pagina is bezocht, betekent dat de toestand van het SWF object gedefinieerd moet zijn. Deze sectie presenteert drie benaderingen die ingrijpen op verschillende niveaus, zoals Figuur 6 inzichtelijk maakt. De verschillende oplossingsrichtingen worden uiteindelijk tegen de volgende eisen aangehouden: Toekomstbestendig dit betreft het aspect of de oplossing aangepast moet worden als er een update van Flash of nieuwe technologie wordt geïntroduceerd. Mate van automatisering dit betreft de mate waarin de oplossing handwerk vereist, dan wel volledig automatisch opereert. Volledigheid met betrekking tot aantal pagina s dit betreft de mate waarin een website volledig doorzocht kan worden. Schaalbaarheid dit betreft de mate waarin de oplossing op grote schaal toepasbaar is, dit is vooral afhankelijk van de rekenintensiviteit van de oplossing. Toepasbaarheid dit betreft het relatieve aantal cases dat de oplossing van toepassing is. Complexiteit van de oplossing dit betreft de benodigde inzet die nodig is om de oplossing te realiseren Pixel-klikken De meest eenvoudige aanpak klikt geautomatiseerd met de muis ieder pixel van het SWF object aan. In dit geval bestaat de virtuele user op het niveau van het operating system. Deze brute-force benadering houdt alleen bij of een pixel is aangeklikt of niet. Nadeel van deze clickbot is dat direct een nieuwe pagina wordt bezocht, zodra een aangeklikt pixel een link bevat. Daardoor worden andere links genegeerd. Dit is belangrijk, omdat er geen logische back -functie is. Een benadering om dit probleem te ontwijken is de pixels niet één-voor-één als scanlijn aan te klikken, maar bijvoorbeeld random door het scherm te laten klikken. In dat geval worden niet alle klikbare elementen in kaart gebracht, maar kan na verloop van tijd worden vastgesteld dat een aanzienlijk deel van de website is geïndexeerd. Deze benadering is niet geschikt voor monitoring doeleinden, maar alleen om een relevante website te identificeren op basis van beschikbare teksten. Belangrijk nadeel van deze benadering zijn websites, waar gescrolld kan worden naar andere informatie. Het is op dit moment ook onduidelijk hoe een toestand gedefinieerd kan worden om vast te stellen of een pagina al bezocht is. Mogelijk kan hier het screenshot van de pagina voor gebruikt worden die met beeldherkenning gerelateerd kan worden aan andere screenshots Virtuele gebruiker door hergebruik van browsertechnologie Een meer geavanceerde clickbot weet waar de links aanwezig zijn in het SWF object. Deze informatie is ook beschikbaar in de webbrowser en wordt zichtbaar doordat bijvoorbeeld de modus van de muispointer veranderd in een hand als de muis over een link schuift. De webbrowser heeft meer kennis over de content in een webpagina en zou op deze manier een alternatieve wijze van crawlen kunnen opleveren. Het is nog een onderzoeksvraag in hoeverre dit leidt tot een structurele

14 TNO-rapport 14 / 34 oplossing, maar het is duidelijk dat browsertechnologie veel mogelijkheden biedt. Een drietal specifieke vragen zal beantwoord moeten worden: 1. Op welke manier is bekend in een webbrowser waar clickable regions zijn? Wat is een geschikte open source webbrowser? 2. Hoe kan voor iedere pagina een toestand gedefinieerd worden? 3. In hoeverre kan een SWF object volledig doorzocht worden? Deze oplossing kan leiden tot een plugin, extensie of add-on in een browser die deze functionaliteit biedt. Het grote voordeel van deze benadering is, dat de browsertechnologie hergebruikt kan worden en dat updates automatisch geïnstalleerd kunnen worden, waardoor de oplossing toekomstbestendig is. Mogelijkerwijs zijn er bepaalde beveiligingsproblemen waardoor het toch onmogelijk blijkt om alle pagina s te bezoeken. Tenslotte is het de vraag in hoeverre deze benadering een generieke oplossing biedt voor het ontsluiten van andere RIAs of HTML5 gebaseerde websites Aangepast SWF player Door een SWF player aan te passen is het mogelijk om de player te laten vertellen waar de klikbare gedeeltes zitten en om in het SWF object zelf kliks te emuleren. Deze oplossingsrichting is sterk verbonden aan de GUI test automation tools, die geautomatiseerd testen uitvoeren op SWF objecten om te achterhalen of het object goed functioneert. De eerder gepresenteerde oplossing van Adobe en Google voor het indexeren van SWF objecten maakt ook gebruik van deze aanpak. Nadeel van het aanpassen van de SWF player, is dat dit best een complexe operatie is en een stap die niet goed bestand is tegen toekomstige updates. Om dit te realiseren zal gebruik gemaakt moeten worden van een open source player, terwijl Adobe gesloten is, welke veelal een aantal versies achterlopen. Bovendien is de oplossing specifiek voor Flash en kan hij niet zondermeer worden ingezet voor andere technologieën Aanpassing van het SWF object door decompileren De vierde benadering om een virtuele gebruiker te simuleren, transformeert het SWF object door het object te decompileren, deze vervolgens aan te passen of anders aangepast te compileren. Decompileren is het omgekeerde van compileren. Bij decompileren wordt het door de Flash Player uitvoerbare SWF object omgezet in (een benadering van) de originele broncode en elementen. Door de broncode aan te passen kan het gedrag van de Flash applicatie worden veranderd. Het gedrag is bijvoorbeeld zo aan te passen dat de applicatie elk klikbaar object (zoals knoppen, menu s en linkjes) automatisch in een bepaalde volgorde aanklikt. Een vraag die nog niet beantwoord is, is hoe een toestand of state van de applicatie wordt gedefinieerd. Dit is noodzakelijk om na te kunnen gaan of de hele applicatie is doorlopen en niet te veel dubbele pagina s worden bezocht. Een nadeel van deze benadering is dat deze afhankelijk is van de wijze waarop een object in elkaar zit en daarmee is deze benadering ook minder toekomstbestendig. Een tweede nadeel van deze benadering is dat SWF objecten die gemaakt zijn met Adobe Flash, niet met een aangepaste compiler kunnen worden gecompileerd, omdat er alleen closed-source compilers bestaan van Adobe. Het is wel mogelijk deze objecten te decompileren. In dat geval kan alleen de code (ActionScript)

15 TNO-rapport 15 / 34 worden aangepast en vervolgens moet de Flash tot SWF object gecompileerd worden met behulp van Adobe Flash. Dit vereist automatische code interpretatie, wat een tamelijk complexe operatie is. Er zijn verschillende Flash decompilers beschikbaar, zowel open-source als commercieel. Sommige decompilers kunnen alleen overweg met Flash animaties, terwijl andere ook Flex reproduceren. Daarnaast moet opgemerkt worden dat ook de versies die Flex ondersteunen verschillen vertoond. Dit onderzoek is uitgevoerd met de Flash Decompiler Trillix, versie 4.2 van Eltima Software. Deze decompiler kan overweg met zowel Flash als Flex en ondersteunt Flash CS5 en Flex Conclusies Tabel 3 presenteert de evaluatie van de voorgestelde oplossingsrichtingen op basis van het geïntroduceerde programma van eisen. Tabel 3. Verschillende oplossingsrichtingen om een website te verkennen ten opzichte van de eisen. Pixel-klikken Browsertechnologie SWF player SWF decompileren Toekomstbestendig Automatisering Volledigheid Schaalbaarheid Toepasbaarheid Complexiteit Op basis van deze analyse komt de ontwikkeling van een virtuele gebruiker op basis van browsertechnologie eruit als de meeste interessante benadering, omdat deze benadering nauwelijks nadelen kent. Wel is er een aantal openstaande onderzoeksvragen met betrekking tot deze oplossing. 3.3 Virtual user tekst extractie Tijdens het volledig verkennen van een website is het belangrijk om de (tekstuele) informatie die aan de gebruiker wordt gepresenteerd te extraheren en indexeren. Een crawler, zoals HTTrack, gebruikt de verkregen HTML om te tekst te extraheren. Dit werkt niet voor SWF objecten, omdat de SWF pagina s geen tekstuele pagina s zijn. Deze sectie presenteert vijf oplossingsrichtingen om de statische en dynamische teksten uit SWF objecten te extraheren. Vervolgens worden de verschillende richtingen geëvalueerd op basis van de volgende eisen: Toekomstbestendig dit betreft het aspect of de oplossing aangepast moet worden als er een update van Flash of nieuwe technologie wordt geïntroduceerd. Kwaliteit van verkregen tekst dit betreft het aantal potentiele taal- of tikfouten die voorkomen in de verkregen tekst. Mate van automatisering dit betreft de mate waarin de oplossing opgenomen kan worden in een automatisch verwerking straat.

16 TNO-rapport 16 / 34 Robuust tegen encryptie dit betreft de mate waarin de oplossing in staat is tekst te extraheren, die geencrypt wordt aangeleverd. Schaalbaarheid dit betreft de mate waarin de oplossing op grote schaal kan worden toegepast, een oplossing die erg rekenintensief is, is bijvoorbeeld minder schaalbaar. Toepasbaarheid dit betreft het relatieve aantal cases dat de oplossing van toepassing is. Complexiteit van de oplossing dit betreft de benodigde inzet die nodig is om de oplossing te realiseren OCR van screenshots van de website De meest basale aanpak maakt van ieder scherm dat verkregen wordt een screenshot en herkend automatisch de tekst op deze pagina. Automatische conversie van de tekst in beeld naar platte indexeerbare tekst wordt gedaan met behulp van optical character recognition 12 (OCR). Omdat veel informatie op websites ook in beeld wordt gevat is deze technologie verder onderzocht en worden de resultaten gepresenteerd in de hoofdstukken 4 tot en met 6. Het belangrijkste nadeel van OCR is dat de tekst niet altijd perfect wordt herkend, of zoals onze bevindingen laten zien soms zelfs heel slecht wordt herkend. Het belangrijkste voordeel van OCR is dat het altijd toegepast kan worden, op ieder beeld zonder problemen met betrekking tot de interoperabiliteit tussen bijvoorbeeld een webbrowser en een SWF player. Daarnaast is deze oplossing ook robuust tegen teksten die geëncodeerd of versleuteld worden verstuurd Wireshark op het OS Zodra de virtual user een website bezoekt dan veroorzaakt dit netwerkverkeer. Er worden bijvoorbeeld afbeeldingen, filmpjes en dynamische teksten geladen. Dit netwerkverkeer is af te vangen met behulp van een tool als Wireshark 13. Deze netwerk analyse tool kan weergeven welke data er vanaf het internet worden opgehaald, ook als het SWF object niet in een browser wordt afgespeeld. Indien meerder processen tegelijkertijd draaien op de server, dan is het mogelijk lastig om de verschillende datastromen uit elkaar te houden. Het is van belang alleen de aanroepen van de webbrowser af te vangen Firebug vanuit de webbrowser De informatie die door een SWF object wordt weergegeven is niet altijd in het object zelf opgeslagen. Veelal wordt dynamische informatie door het SWF object opgevraagd vanaf een server. Hiervoor doet de SWF player een aanroep naar de server, welke de gevraagde data terugstuurt. Deze aanroepen zijn op verschillende manieren af te vangen. Wanneer het Flash object door een Flash plugin in een browser wordt uitgevoerd kunnen tools als Firebug 14 en ServiceCapture 15 de aanroepen die worden gedaan weergeven

17 TNO-rapport 17 / 34 Zodra duidelijk is welke content gedownload wordt, wil nog niet zeggen dat alle tekst beschikbaar is. Er is vooral bekend welke content gedownload wordt. Als er een nieuw SWF object wordt gedownload, dan zal deze gedecompileerd moeten worden om de statische teksten te extraheren. Een tweede aspect dat relevant is, is dat verschillende data formaten gebruikt worden zoals: XML, JSON, stringencoding, etc. Deze formaten moeten ook verwerkt worden, voordat content geïndexeerd kan worden Aanpassing SWF player Een vierde oplossingsrichting om tekst te extraheren is het aanpassen van de SWF player. Het slimst is om de tekst af te vangen vlak voor het moment dat de tekst gerenderd wordt. Het grote voordeel van deze benadering is dat hij robuust is tegen websites die de data versleuteld versturen, omdat de tekst geëxtraheerd wordt nadat deze is gedecrypt. Deze oplossingsrichting is tamelijk complex omdat het aanpassingen op een SWF player betreft, hiertoe is een open source player nodig zoals Gnash 16. Nadeel is dat deze open source player elke keer aangepast moet worden als er een update van het SWF format plaatsvindt. Daarnaast lopen open source players regelmatig achter op de meest recente versie van Adobe Decompileren voor tekstextractie Het is ook mogelijk om een SWF object te decompileren in zijn originele bouwblokken om vervolgens uit de verkregen broncode de tekst te filteren. Het verkregen resultaat bevat naast de tekst, broncode ook al het beeldmateriaal. Daarnaast is het ook mogelijk om URLs die volledig zijn uit het SWF object te extraheren. Het verkrijgen van dynamische content ligt gecompliceerder. Deze teksten worden eenvoudiger geëxtraheerd op basis van Firebug-achtige oplossingen, omdat deze calls veelal op run-time samengesteld worden en dus niet als zodanig beschikbaar zijn in de broncode van het SWF object Conclusies Tabel 4 presenteert de verschillende oplossingen om tekst te extraheren ten opzichte van de geïntroduceerde eisen. Tabel 4. Verschillende oplossingsrichtingen om tekst te extraheren uit SWF objecten ten opzichte van de eisen. OCR screenshots Wireshark Firebug SWF player Decompileren Toekomstbestendig Tekstkwaliteit Automatisering Encryptie Schaalbaarheid Toepasbaarheid Complexiteit

18 TNO-rapport 18 / 34 Een hybride oplossing om op basis van het decompileren van SWF objecten om statische teksten te extraheren in combinatie met het afvangen van dynamische content via de Firebug oplossing, lijkt een zeer interessante oplossingsrichting. Nadeel is dat deze oplossingsrichting niet robuust is tegen encryptie. Een interessant bijproduct van het decompileren is dat ook alle losse grafische elementen verkregen worden die mogelijk ook informatief zijn. 3.4 Conclusies met betrekking tot de oplossingsrichtingen De Google-Flash oplossing werkt alleen onder beperkte voorwaarden en is niet beschikbaar voor andere gebruikers als Google en Yahoo. Deze benadering biedt daarom geen totaal oplossing die algemeen bruikbaar is. Daarentegen is de benadering die gebruik maakt van een virtuele gebruiker wel erg interessant. Om SWF objecten goed te indexeren is geconcludeerd dat een virtuele gebruiker onderzocht moet worden die bestaat uit de volgende twee componenten: Verkennen van de Flash website door browsertechnologie te (her)gebruiken, en op die wijze een website volledig geautomatiseerd te doorlopen. Tekstextractie uit de verkregen content lijkt het best te realiseren alle content af te vangen met een tool als Firebug en vervolgens XML en HTML te verwerken volgens de traditionele benadering en de tekst uit de statische teksten uit SWF objecten te halen door deze te decompileren. Een belangrijke onderzoeksvraag is: in hoeverre is dit een generieke oplossing ook voor andere RIAs die niet zijn gebaseerd op SWF objecten, maar bijvoorbeeld op HTML5 of Ajax.

19 TNO-rapport 19 / 34 4 Tekst in afbeeldingen op het internet Een groot aantal afbeeldingen op het internet bevatten tekst. Deze afbeeldingen kunnen verschillende doelen dienen, zoals het presenteren van een reclame banner, tekst in een button of tekst die toevallig aanwezig is in de achtergrond. Om enig gevoel te krijgen bij de relevantie van tekst in afbeeldingen op het internet presenteert dit hoofdstuk twee analyses. Een inventarisatie van tekst in een groot aantal afbeeldingen afkomstig van het internet en vervolgens worden twee relevante cases geïntroduceerd. 4.1 Inventarisatie van tekst in afbeeldingen op het internet Om inzicht te krijgen in het gebruik van tekst in afbeeldingen op het internet is een analyse gemaakt van alle afbeeldingen die bekeken zijn in een periode van een half jaar door middel van een webbrowser. Er wordt aangenomen dat dit een enigszins representatief beeld oplevert van het gebruik van afbeeldingen op het internet. Deze afbeeldingen zijn afkomstig uit de cache van de webbrowser. De verschillende afbeeldingen zijn ingedeeld in zeven categorieën: info tekst, button tekst, logo tekst, banner tekst, map tekst, achtergrond tekst en afbeeldingen met geen tekst. Figuur 7 presenteert voor iedere categorie een voorbeeld. Achtergrond teksten zijn afbeeldingen waarin de tekst zich in de achtergrond bevindt, zoals zuiderheide in Figuur 7. Button tekst Logo tekst Banner tekst Info tekst Achtergrond tekst Map tekst Figuur 7. De 6 voorbeeld categorieën van tekst in afbeeldingen op het internet. Deze inventarisatie heeft bijna 10 duizend afbeeldingen gecategoriseerd zoals Tabel 5 presenteert. De afbeeldingen zijn tevens gecategoriseerd naar afbeeldingsformaten: gif, jpg en png. Op basis van deze inventarisatie kunnen de volgende conclusies worden getrokken: Ongeveer 25% van de afbeeldingen op het internet bevat tekst. Tekst zit voornamelijk in afbeeldingen met logo s, banners en plattegronden. Als tekst in de achtergrond zit, dan betreft het altijd foto s die zijn opgeslagen als een jpg geëncodeerde afbeelding.

20 TNO-rapport 20 / 34 Tabel 5. Statistieken van de verschillende categorieën met tekst in afbeeldingen op het internet. GIF JPG PNG ALL Info tekst 81 0,8% 25 0,3% 6 0,1% 112 1,1% Button tekst 29 0,3% 7 0,1% 11 0,1% 47 0,5% Logo tekst 116 1,2% 272 2,7% 154 1,5% 542 5,4% Banner tekst 182 1,8% 259 2,6% 59 0,6% 500 5,0% Map tekst 0 0,0% 0 0,0% 855 8,6% 855 8,6% Background tekst 3 0,0% 300 3,0% 4 0,0% 307 3,1% No tekst ,3% ,4% 658 6,6% ,3% ,4% ,1% ,5% ,0% Veel tekst in de afbeeldingen op het internet is erg klein. Dit maakt herkenning van deze teksten met OCR complex. De randvoorwaarden voor het herkennen van tekst in beeld worden in kaart gebracht in hoofdstuk Contactinformatie in beeldmateriaal De website marktplaats.nl presenteert de telefoonnummers van verkopers als afbeeldingen. Dit voorkomt dat zoekmachines en robots deze informatie kunnen zien, indexeren en koppelen aan andere informatie. Voor de internetgebruiker maakt dat niet uit, want je ziet pas dat de tekst is opgenomen in een afbeelding als je de tekst wilt selecteren. Voor zoekmachines maakt dit wel degelijk uit. Op het moment kunnen zoekrobots dergelijke afbeeldingen (nog) niet lezen, terwijl optical character recognition (OCR) beschikbaar is. In de toekomst zullen zoekmachines zoals Google deze technologie gaan gebruiken om afbeeldingen te indexeren. Figuur 8. screenshot van Marktplaats 17, het telefoonnummer is een plaatje en geen tekst. In voorbeeld B wordt contactinformatie als afbeelding gepresenteerd. Op deze site wordt alle contactinformatie: naam, adres, telefoonnummer als afbeelding gepresenteerd. 17 In deze en andere screenshots in dit rapport is privacy gevoelige informatie onherkenbaar gemaakt.

21 TNO-rapport 21 / 34 Figuur 9. screenshot van case B met de contactinformatie als afbeelding. Beide voorbeelden worden in het vervolg van dit hoofdstuk gebruikt als use-cases. Voor marktplaats wordt gericht op het (automatisch) herkennen van het telefoonnummer en voor B wordt gericht op het herkennen van adresgegevens. 4.3 Conclusies De inventarisatie heeft laten zien dat een significant aantal afbeeldingen op het internet tekst bevat. Deze teksten worden tot op heden niet geïndexeerd. Onder andere omdat dit erg lastig is, zal dit niet direct op grote schaal gebeuren. De twee use-cases laten zien dat relevante informatie in de vorm van tekst in afbeeldingen wordt opgenomen. Deze teksten moeten uiteindelijk ook automatisch verwerkt kunnen worden, zodat bijvoorbeeld de contact gegevens van dezelfde personen gekoppeld kunnen worden. Deze use-cases zullen verder onderzocht worden om de tekst automatisch te herkennen. Wat opvalt in de inventarisatie is dat meer dan 10% van de afbeeldingen logo s bevatten. Dit zijn de afbeeldingen die alleen een logo bevatten, maar ook afbeeldingen met een banner waarin ook een logo voorkomt. Naast het automatisch herkennen van tekst is het ook interessant om logo s te herkennen. Deze technologie is evenals tekstherkenning erg robuust aan het worden.

22 TNO-rapport 22 / 34 5 Tekstextractie met OCR technologie Dit hoofdstuk presenteert de bevindingen met betrekking tot het herkennen van tekst met OCR technologie in de twee geïntroduceerde use cases. Deze inzichten bieden handvatten om OCR technologie in de praktijk toe te passen. Eerst wordt OCR technologie geïntroduceerd, vervolgens wordt deze technologie toegepast op de use cases. Om een betere herkenningskwaliteit te behalen wordt een overzicht gegeven van de verschillende parameters die ingesteld kunnen worden om de kwaliteit te verbeteren. Tenslotte wordt een door TNO ontwikkelde user interface voor een open-source OCR pakket geïntroduceerd, waarmee eenvoudig experimenten kunnen worden uitgevoerd. 5.1 Introductie OCR technologie Technologie om automatische tekst te herkennen wordt OCR (Optical Character Recognition) of ICR (Intelligent Character Recognition) genoemd. OCR is oorspronkelijk ontwikkeld voor geprinte documenten die vervolgens gescand zijn. Er moet bij OCR een onderscheid worden gemaakt tussen handgeschreven en geprinte tekst. OCR software is voornamelijk bedoeld voor geprinte tekst, ICR richt zich meer op de herkenning van geschreven tekst. De huidige generatie OCR software kan naast tekst ook de complete opmaak (gebruikte lettertypes, figuren) achterhalen. Ondanks dat OCR software veel belovend is, blijkt het gebruik ervan in de praktijk niet altijd even triviaal. OCR technologie heeft een rijke historie, waardoor een groot aantal verschillende OCR pakketten is ontwikkeld. Er zijn drie categorieën aan te merken: open source, commerciële en maatwerk software. Tabel 6 presenteert voor iedere categorie drie belangrijke pakketten of spelers. Dit zijn veel gebruikte OCR pakketten. Voor dit project zijn voornamelijk de open source en commerciële software pakketten relevant. Maatwerkoplossingen zijn prijzig en richten zich veelal op specifieke problemen. Hierbij kan bijvoorbeeld gedacht worden aan het real-time herkennen van ingebrande ondertitels in TV programma s. Het belangrijkste open source OCR pakket is op dit moment Tesseract. Google heeft in 2006 de ontwikkeling van Hewlet-Packard overgenomen en gebruikt deze technologie in haar streven om veel oud leesmateriaal doorzoekbaar en toegankelijk te maken. Veel andere open source initiatieven zijn gestopt met verdere doorontwikkeling. Dat Tesseract de meest krachtige open source oplossing is, blijkt uit het feit dat andere open source initiatieven (zoals bijvoorbeeld Ocropus) ook deze engine zijn gaan gebruiken, omdat die veelal een betere performance laat zien dan de eigen ontwikkelde engine.

23 TNO-rapport 23 / 34 Tabel 6. Per OCR software categorie drie belangrijke pakketten of spelers. Open source Commercieel Maatwerk Tesseract 18 FineReader 19 PrimeVision 20 Ocropus 21 Parascript 22 Autonomy 23 gocr 24 Nuance OmniPage 25 SRI 26 De meest bekende en best aangeschreven commerciële OCR software is FineReader van Abbyy. Een OCR pakket dat al geruime tijd bestaat en een betrouwbare en robuuste performance biedt. Abbyy biedt finereader aan als een consumentenproduct en als een bibliotheek die andere programmabouwers kunnen gebruiken. Voor het verdere onderzoek naar automatische tekst herkenning zullen deze twee pakketten gebruikt worden. Het is belangrijk te beseffen dat de OCR software is geoptimaliseerd voor: geprinte tekst, scan resoluties: 150, 300 en 600 dpi (dots per inch), papierformaat: A4 in Europa, US letter in VS, Microsoft Word document opmaak, Microsoft Word standaard lettertypen (Times Roman 10.5 punt). Doordat beeldmateriaal van het internet deze karakteristieken niet altijd heeft, wordt de tekst in deze afbeeldingen niet altijd even goed herkend. De volgende sectie presenteert de oplossing om de use-cases goed te herkennen. In feite komt het er op neer dat het beeldmateriaal zodanig aangepast moet worden, dat het de karakteristieken heeft waarvoor OCR software is geoptimaliseerd. 5.2 OCR technologie toegepast op de use-cases Voor het praktische gebruik van OCR software is de belangrijkste les dat het beeldmateriaal goed moet aansluiten op de kenmerken waarvoor de OCR software is geoptimaliseerd: gescande, papieren, geprinte documenten. Als voorbeeld B door Tesseract geanalyseerd wordt, dan wordt er nauwelijks een karakter correct herkend, zoals Figuur 10 laat zien. FineReader geeft in dit geval in zijn geheel geen resultaat terug

24 TNO-rapport 24 / 34 Figuur 10. Herkenningsresultaat van Tesseract zonder enige beeldverbetering; alleen mr R D en arnhem zijn correct herkend. Om use case B goed te herkennen moet het beeldmateriaal naar het formaat van een gescand document gebracht worden. Dit betekent voor deze use-case dat de afbeelding moet worden opgeschaald (in beeldresolutie verhoogd). Ondanks dat deze operatie geen informatie toevoegt, brengt de operatie de tekst wel in het geoptimaliseerde domein van de OCR software. Figuur 11 presenteert een voorbeeld waarin de contactinformatie wel correct is herkend. Met Tesseract wordt voor deze case dezelfde herkenningskwaliteit behaald. Figuur 11. Correct herkende contactinformatie met FineReader, nadat het originele beeld een factor twee was opgeschaald en een kleine witte rand was toegevoegd. Figuur 12 presenteert de grafische gebruikersinterface van FineReader. Deze is gemakkelijk te bedienen en laat eenvoudig zien of bepaalde digitale beelden correct worden herkend. Indien dit het geval is, dan is het mogelijk de FineReader engine te gebruiken als bibliotheek, zodat de OCR technologie opgenomen kan worden in een geautomatiseerde content analyse straat.

25 TNO-rapport 25 / 34 Figuur 12: Screenshot van FineReader: na vergroten van de afbeelding kan Finereader de tekst wel lezen. Legenda: links boven en onder de originele afbeelding, rechtsboven het OCR resultaat van FineReader, het groene blok identificeert de door FineReader gevonden tekstblokken. Tesseract heeft geen grafische gebruikersinterface en kan slechts worden gebruikt in command-line modus. Voor de werking van OCR maakt dat uiteraard niet uit. De syntax voor het gebruik van Tesseract op de command-line wordt gepresenteerd in Tabel 7. Tabel 7. Command-line aanroep van Tesseract > tesseract plaatje.ext resultaat l nld Waarbij plaatje.ext het input plaatje is, met.ext het extensietype. Bijvoorbeeld plaatje.png of plaatje.gif. Tesseract stopt het resultaat in de file resultaat.txt (als resultaat als output parameter wordt gekozen). De laatste optie -l nld selecteert de Nederlandse taal in OCR. Dit is een van de instellingen die gekozen kan worden om de herkenningskwaliteit te verbeteren. Na beeldverbetering herkent ook Tesseract de tekst zonder fouten, zoals Figuur 13 laat zien.

26 TNO-rapport 26 / 34 Figuur 13. Screenshot Tesseract in command-line mode, met het OCR resultaat van Tesseract na beeldverbetering. De gebruikte command line is MinGW, een Unix shell voor Windows; het Unix cat commando laat de inhoud van een tekstfile zien. 5.3 Beeldverbetering voor optimaal OCR resultaat Om tekst goed te herkennen moet de tekst in de afbeelding getransformeerd worden naar de randvoorwaarden waarvoor de OCR software is geoptimaliseerd. Deze transformaties bestaan uit de volgende vier stappen: 1 Selectie van de tekst 2 Oriënteren van de tekst 3 Kleurcorrectie 4 Schalen van de tekst (vergroten van de beeldresolutie) De volgende secties gaan dieper op deze stappen in Selectie van de tekst in de afbeelding Voor de automatische extractie van tekst is het belangrijk dat het plaatje alleen tekst bevat en zo min mogelijk verstoringen in de achtergrond. OCR software is wel in staat om onderscheid te maken tussen tekst en niet-tekst (zoals figuren, grafieken, plaatjes, foto s), maar de beeldelementen die geen tekst zijn, kunnen het OCR resultaat verstoren als het OCR pakket bepaalde delen als tekst aanmerkt. Vaak bevatten internet afbeeldingen alleen tekst, zoals de use-cases marktplaats en case B laten zien. Maar het komt ook geregeld voor dat een plaatje naast tekst andere zaken bevat. Verder is het belangrijk dat tekst die uit meerdere kolommen bestaat apart te verwerken als het belangrijk is de opmaak/structuur te behouden. Niet elke OCR engine kan bij een beperkte hoeveelheid tekst goed zien, waar de kolom begint en eindigt, zodat OCR resultaten incorrect over de kolommen worden gespreid Horizontaal georiënteerde tekstregels OCR software is ook gevoelig voor de oriëntatie van de tekstregels, deze moeten zoveel mogelijk echt horizontaal zijn. Een rotatie groter dan 5 graden linksom of 10 graden rechtsom zorgt ervoor dat de herkenning ineens snel minder wordt. Als de tekst nog verder afwijkt, zal de OCR software de tekst steeds slechter gaan herkennen. Het is dan ook van belang om de tekst te transformeren, zodat deze wordt gepositioneerd als horizontale tekstregels.

27 TNO-rapport 27 / Donkere karakters op een witte achtergrond Geprinte documenten bestaan meestal uit zwarte letters op een egaal witte achtergrond. De meeste OCR softwarepakketten werken dan ook alleen met dit negatieve contrast (zwart op wit). Als de tekst in de afbeeldingen andere kenmerken heeft, is het belangrijk om deze te transformeren naar donkere tekst op een lichte achtergrond, voordat het beeld wordt aangeboden aan de OCR software Resolutie van de tekst Zoals hierboven beschreven heeft use-case B laten zien dat de pixel-resolutie van de afbeelding van groot belang is voor een goed OCR resultaat. Dit komt omdat scanners vaak met een bepaalde resolutie (DPI of dots-per-inch/puntjes per 2,54cm) documenten scannen. Vaak voorkomende resoluties zijn veelvouden van 300DPI: 600DPI en 900DPI. Als het internetplaatje met tekst die resolutie niet haalt, wordt er simpelweg geen tekst gelezen. De oplossing is om het beeld op te schalen of te vergroten zodat de tekst in het juiste bereik komt. Het programma IrfanView 27 heeft bijvoorbeeld een (geavanceerde) batch mode, waarmee een hele verzameling plaatjes kan worden geconverteerd naar een bepaalde resolutie. 5.4 Relevante instellingen in de OCR software Om de tekst zo goed mogelijk te herkennen zijn een aantal instellingen in de OCR software die gekozen kunnen worden. Hiervoor is bepaalde voorkennis nodig over de te herkennen teksten Gebruikte taal Het is niet heel duidelijk zichtbaar, maar de taalkeuze in het OCR pakket is ook van belang bij een goede herkenning van de tekst in het beeld. De taalkeuze bepaalt de statistische waarschijnlijkheden van bepaalde letters, opeenvolging van letters en voorkomens van woorden. Zoals Tabel 7 al liet zien voor de aanroep van Tesseract kan aangegeven worden dat het Nederlandse taal betreft met behulp van het argument: -l nld Alleen cijfers of letters Indien zeker is dat een afbeelding alleen cijfers of alleen letters bevat dan kan deze informatie bij sommige OCR pakketten worden meegegeven. Dit is bijvoorbeeld relevant bij de herkenning van telefoonnummers. Zeker als het beeld alleen cijfers bevat is het verstandig dit aan te geven, want een OCR pakket heeft over het algemeen namelijk een voorkeur voor een l in plaats van een 1 en een o in plaats van een 0, omdat in normale tekst de letters l en o vaker voorkomen dan de cijfers 1 en Lettertype Soms is bekend welk lettertype is gebruikt voor de tekst in beeld. Bij een enkel OCR pakket kan je dit instellen voor een iets betere herkenning van de tekst. Het volgende hoofdstuk presenteert een korte vergelijking tussen Tesseract en FineReader en daarin wordt ook de afhankelijkheid van de verschillende lettertypes meegenomen (IrfanView voor beeldverwerking)

28 TNO-rapport 28 / TNO research tooling TNO heeft een tool ontwikkeld op basis van python en OpenCV 28, waarmee eenvoudig verschillende experimenten kunnen worden uitgevoerd met OCR software. De tool kan een verzameling beelden verwerken aan de hand van een recept dat is gedefinieerd op basis van een voorbeeldafbeelding. Figuur 14 tot en met 17 presenteren voorbeelden van deze tool om een recept te ontwikkelen. Figuur 14. Gebruikersinterface van de TNO tool om een afbeelding in te lezen. Figuur 15. Resultaat van het vergroten van de afbeelding met een bepaalde factor. 28

29 TNO-rapport 29 / 34 Figuur 16. Resultaat nadat de afbeelding door de OCR software is geanalyseerd. 5.6 Conclusies De Marktplaats en B case hebben aangetoond dat OCR technologie niet vanzelf tot het gewenste resultaat leidt. Aan de hand van case B hebben we echter laten zien dat het goed mogelijk om na enige tuning met hoge kwaliteit deze tekst te herkennen. Deze tuning betreft een aantal keuzes voor beeldverbeteringen of instellingen van de OCR software. De samenhang van deze keuzes kan gezien worden als een recept dat moet worden uitgevoerd. Het recept dat nodig is voor de marktplaats en use-case B is beperkt tot het opschalen van het beeld. In het geval van de Marktplaats case kan het resultaat nog verder verbeterd worden door aan te geven dat slechts cijfers hoeven worden herkend. Figuur 17 presenteert alle potentiële onderdelen van het recept om tekst in een afbeelding te herkennen. Figuur 17: Alle potentiële onderdelen van het OCR recept om tekst in afbeeldingen te herkennen. Een recept wordt veelal ontwikkeld om afbeeldingen te verwerken met bekende kenmerken. Daarom is OCR zeer geschikt om in vergelijkbare cases als marktplaats en case B tekst in afbeeldingen te herkennen. Als onbekend materiaal verwerkt moet worden, zou automatisch het recept moeten worden afgeleid op basis van de afbeelding. Dit is een complex proces die buiten de scope van dit project valt.

~L~g. for life. Virtuele muis. Offerte. . innovation. Haalbaarheidstudie naar hergebruik browsertechnologie voor effectieve webcrawl ing

~L~g. for life. Virtuele muis. Offerte. . innovation. Haalbaarheidstudie naar hergebruik browsertechnologie voor effectieve webcrawl ing . innovation Virtuele muis Haalbaarheidstudie naar hergebruik browsertechnologie voor effectieve webcrawl ing Offerte Deze offerte is uitgebracht aan: NCTV Postbus 16950 2500 BZ Den Haag Klantcontact Naam

Nadere informatie

Documenten scannen met OCR

Documenten scannen met OCR Documenten scannen met OCR Wat betekent OCR eigenlijk? OCR staat voor: "Optical Character Recognition" in het Nederlands optische tekenherkenning. Je kunt er papieren documenten mee scannen, die dan niet

Nadere informatie

HTML. Media. Hans Roeyen V 3.0

HTML. Media. Hans Roeyen V 3.0 Media Hans Roeyen V 3.0 12 maart 2015 Inhoud 1. (Multi)Media op websites... 3 2. Flash en Websites... 4 3. Video op je website... 4 3.1. YouTube insluiten op de pagina... 4 3.2. Video zonder YouTube...

Nadere informatie

e isoverdr chtbee erkhe enni gvoor o e b reo ee veilig ei

e isoverdr chtbee erkhe enni gvoor o e b reo ee veilig ei e isoverdr chtbee erkhe enni gvoor o e b reo ee veilig ei ffe e Deze offerte is uitgebracht aan: NCTV Postbus 16950 2500 BZ Den Haag Klantcontact Naam contactpersoon: Telefoonnummer: E-mail: Copynght ~

Nadere informatie

Release notes Argo 7. Interactieve LMS interface. Nieuwe interface voor lesmodules

Release notes Argo 7. Interactieve LMS interface. Nieuwe interface voor lesmodules Release notes Argo 7 Argo 7 heeft een interactief web design. Het is optimaal afgestemd op de grote diversiteit aan computerbeeldschermen, van grootbeeld desktops en notebooks tot tablets en smart phones.

Nadere informatie

Selenium IDE Webdriver. Introductie

Selenium IDE Webdriver. Introductie Selenium IDE Webdriver Het Wielsem 10, 5231 BW s- Hertogenbosch, telefoon 073-6409311 e- mail info@testwork.nl internet http://www.testwork.nl 1 Inhoudsopgave 1 Inhoudsopgave... 2 2 Selenium IDE... 3 3

Nadere informatie

Grafisch ontwerp. Referenties. https://developers.google.com/webmasters/mobile-sites/ http://www.bluetrainmobile.com/mobile-showcase

Grafisch ontwerp. Referenties. https://developers.google.com/webmasters/mobile-sites/ http://www.bluetrainmobile.com/mobile-showcase Mobiel Datanose Op dit moment is mobiel datanose niet goed gedaan; je krijgt gewoon de site te zien zoals je het te zien krijgt op pc's of laptops. Maar vaak heb je het probleem dat je op je mobiel moet

Nadere informatie

Toegankelijkheid documenten

Toegankelijkheid documenten Toegankelijkheid documenten 1. Verschillende bestandstypen Er zijn veel verschillende soorten documenten in gebruik, met allemaal hun eigen kenmerken en toegankelijkheid voor visueel beperkten. In principe

Nadere informatie

Frontend performance meting

Frontend performance meting Frontend performance meting als aanvulling op de traditionele manier van performancetesten René Meijboom rene@performancearchitecten.nl Introductie Uitdaging bij huidige klant Succesvolle performancetest

Nadere informatie

Omzeil het gebruik van mappen en bestanden over Wiki s en het werken in de 21 e eeuw

Omzeil het gebruik van mappen en bestanden over Wiki s en het werken in de 21 e eeuw Omzeil het gebruik van mappen en bestanden over Wiki s en het werken in de 21 e eeuw In de whitepaper waarom u eigen documenten niet langer nodig heeft schreven we dat het rondmailen van documenten geen

Nadere informatie

WEBSITE USABILITY. white-paper

WEBSITE USABILITY. white-paper WEBSITE USABILITY white-paper Alle rechten voorbehouden Het is niet toegestaan deze white-paper aan derden te verstrekken of te verkopen. Het is niet toegestaan de inhoud van deze white-paper elders te

Nadere informatie

Inhoud Installatie en Setup... 5 IRISCompressor gebruiken... 13

Inhoud Installatie en Setup... 5 IRISCompressor gebruiken... 13 Gebruikshandleiding Inhoud Introductie... 1 BELANGRIJKE OPMERKINGEN... 1 Juridische informatie... 3 Installatie en Setup... 5 Systeemvereisten... 5 Installatie... 5 Activering... 7 Automatische update...

Nadere informatie

Hoewel veel mobiele sites zijn ontworpen met het oog op weergave op mobiele apparaten, zijn ze vaak niet goed toegankelijk via een zoekmachine.

Hoewel veel mobiele sites zijn ontworpen met het oog op weergave op mobiele apparaten, zijn ze vaak niet goed toegankelijk via een zoekmachine. Mobiele websites Een mobiele site is een website die geoptimaliseerd is voor gebruik op een klein scherm en wordt getoond via de browser van een smartphone of tablet. Een mobiele site is niet afhankelijk

Nadere informatie

WHITEPAPER. Wat is een. Responsive website? Voordelen van een. Responsive website? Hoe start je met een. Responsive website? RESPONSIVE WEBSITES

WHITEPAPER. Wat is een. Responsive website? Voordelen van een. Responsive website? Hoe start je met een. Responsive website? RESPONSIVE WEBSITES WHITEPAPER RESPONSIVE WEBSITES Wat is een Responsive website? Voordelen van een Responsive website? Hoe start je met een Responsive website? INTRODUCTIE Met het downloaden van deze whitepaper kunnen we

Nadere informatie

Handleiding: Whitelabel Customersite

Handleiding: Whitelabel Customersite ARGEWEB B.V. Handleiding: Whitelabel Customersite Controlportal.nl Argeweb Support 8-1-2009 Handleiding voor het gebruik maken van de Whitelabel Customersite op controlportal.nl, door Resellers van Argeweb.

Nadere informatie

icafe Project Joeri Verdeyen Stefaan De Spiegeleer Ben Naim Tanfous

icafe Project Joeri Verdeyen Stefaan De Spiegeleer Ben Naim Tanfous icafe Project Joeri Verdeyen Stefaan De Spiegeleer Ben Naim Tanfous 2006-2007 Inhoudsopgave 1 2 1.1 Programmeertaal PHP5..................... 2 1.2 MySQL database......................... 3 1.3 Adobe Flash...........................

Nadere informatie

omgaat met mobiel zoeken

omgaat met mobiel zoeken Content Marketing Gids Hoe Google omgaat met mobiel zoeken 1 Wat doet Google op gebied van de werking van haar zoekmachine en mobiel-(on)vriendelijke websites? Wat betekent dat, een mobiel-(on)vriendelijke

Nadere informatie

SAP Invoice Management (SIM)

SAP Invoice Management (SIM) (SIM) Copyright 2005 Avelon BV Pagina 1 / 10 1 Inleiding Voor veel organisaties is het afhandelen van binnenkomende facturen een handmatig proces dat veel tijd in beslag neemt. Handmatige invoer, tijdrovend

Nadere informatie

Gebruikershandleiding GO search 2.0

Gebruikershandleiding GO search 2.0 Gebruikershandleiding GO search 2.0 1 Gebruikershandleiding Product: GO search 2.0 Documentversie: 1.1 Datum: 2 februari 2015 Niets uit deze uitgave mag zonder toestemming van GemeenteOplossingen worden

Nadere informatie

VMBO-ICT-Route examen 2009 Naam: Marc Schattorie Datum: 06-03-09

VMBO-ICT-Route examen 2009 Naam: Marc Schattorie Datum: 06-03-09 VERSLAG BICS INSTRUCTIIEFIILMPJES VMBO-ICT-Route examen 2009 Naam: Marc Schattorie Datum: 06-03-09 Inhoudsopgave Gebruik BICS..blz. 3 Onderzoek naar korte instructiefilms...blz. 3 Onderzoek naar screenrecorders.blz.

Nadere informatie

Globale kennismaking

Globale kennismaking Globale kennismaking Kennismaking Tesla CMS 1. Dashboard 2. pagina beheer - pagina aanmaken - pagina aanpassen - pagina verwijderen - pagina seo opties - zichtbaarheid pagina 3. subpagina beheer - subpagina

Nadere informatie

Handleiding Coligo Connect installatie en gebruik

Handleiding Coligo Connect installatie en gebruik Handleiding Coligo Connect installatie en gebruik Version 1.0 Content 1. Inleiding... 3 1.1 Introductie... 3 2. Installeren en in gebruik nemen van Coligo Connect... 3 2.1 Downloaden... 3 2.2 Installeren...

Nadere informatie

Stappenplan. De ontwikkeling van een interface doorloopt bij Studio Wolf vier stappen. Deze stappen verduidelijken de weg naar het eindresultaat.

Stappenplan. De ontwikkeling van een interface doorloopt bij Studio Wolf vier stappen. Deze stappen verduidelijken de weg naar het eindresultaat. Stappenplan Een interface is in principe alles wat de communicatie tussen de gebruiker en de computer bepaalt of vorm geeft. Het is het deel van de website of webapplicatie dat de interactie met de gebruiker

Nadere informatie

Gebruikershandleiding Beeldmateriaal

Gebruikershandleiding Beeldmateriaal Gebruikershandleiding Beeldmateriaal Inhoudsopgave 1 Inleiding... 3 1.1 Wat is de Landelijke Voorziening Beeldmateriaal?... 3 2 Levering van de luchtfoto s... 4 2.1 Luchtfoto s via webservices... 4 2.2

Nadere informatie

HANDLEIDING DOIT BEHEER SYSTEEM

HANDLEIDING DOIT BEHEER SYSTEEM HANDLEIDING DOIT BEHEER SYSTEEM ALGEMENE INFORMATIE Het Doit beheer systeem is een modulair opgebouwd systeem waarin modules makkelijk kunnen worden toegevoegd of aangepast, niet iedere gebruiker zal dezelfde

Nadere informatie

SEO search engine optimalisatie

SEO search engine optimalisatie SEO search engine optimalisatie SEO staat voor Search Engine Optimizer, iedereen kan een website maken maar is uw website ook goed uit te lezen door een zoekmachine? Een zoekmachine ziet uw website niet

Nadere informatie

Klik&Steen Dashboard. Wat zijn nou interessante statistieken bij websites?

Klik&Steen Dashboard. Wat zijn nou interessante statistieken bij websites? Klik&Steen Dashboard Wat zijn nou interessante statistieken bij websites? Inleiding Dit document dient als onderzoek naar de statistieken die interessant zijn om te laten zien in het dashboard van Klik&Steen.

Nadere informatie

A SIMSTAT - ALGEMEEN A-1 B SIMSTAT - BEHEER B-1

A SIMSTAT - ALGEMEEN A-1 B SIMSTAT - BEHEER B-1 A SIMSTAT - ALGEMEEN A-1 A.1 OVER SIMSITE A-1 A.2 TECHNISCHE SPECIFICATIES A-1 A.3 AAN DE SLAG A-2 B SIMSTAT - BEHEER B-1 B.1 AUTORISATIE B-1 B.2 ALGEMEEN B-1 B.2.1 HUIDIGE SITUATIE B-1 B.2.2 DAGELIJKS

Nadere informatie

Coligo conne ct. Gebruikershandleiding

Coligo conne ct. Gebruikershandleiding Coligo conne ct Gebruikershandleiding Content 1. Inleiding... 3 1.1 Introductie... 3 2. Installeren en in gebruik nemen van Coligo Connect... 3 2.1 Downloaden... 3 2.2 Installeren... 3 2.3 Inloggen...

Nadere informatie

HTML5 VIDEO. Een stand van zaken Jeroen Wijering, LongTail Video

HTML5 VIDEO. Een stand van zaken Jeroen Wijering, LongTail Video HTML5 VIDEO Een stand van zaken Jeroen Wijering, LongTail Video WHOIS JW? Auteur van de JW Player (2005) Open-source Flash video speler voor embedden in websites. Gebruikt door YouTube in 1e jaar Helaas,

Nadere informatie

1 Inleiding. 3 Handmatig... invoeren zaken basis 4 Verwerken... zaken 5 Afhandelen... van zaken. 7 Uitgebreidere... zaak opties

1 Inleiding. 3 Handmatig... invoeren zaken basis 4 Verwerken... zaken 5 Afhandelen... van zaken. 7 Uitgebreidere... zaak opties 2 Supportdesk Pro Introductie Inhoudsopgave I Supportdesk Pro 3 1 Inleiding... 3 2 Werkwijze... 3 II Zaken 4 1 Introductie... 4 2 Zaken beheren... 4 3 Handmatig... invoeren zaken basis 4 4 Verwerken...

Nadere informatie

Documentatie gereedschapbeheer android applicatie. GB Inspect. Handleiding Gereedschapbeheer android applicatie GB Inspect - 1

Documentatie gereedschapbeheer android applicatie. GB Inspect. Handleiding Gereedschapbeheer android applicatie GB Inspect - 1 GB Inspect Handleiding Gereedschapbeheer android applicatie GB Inspect Datum: 10 september 2014 Behorende bij app versie 1.1.5-1 1. Inleiding De Gereedschapbeheer.nl app is bedoeld voor het inspecteren

Nadere informatie

Toelichting release notes. 23 oktober 2014

Toelichting release notes. 23 oktober 2014 Toelichting release notes 23 oktober 2014 2 Toelichting release notes 23 oktober 2014 Inleiding release notes Deze week ontvangen jullie de release notes waarin onder meer twee nieuwe Paddlets, verschillende

Nadere informatie

Bewerk uw eigen Digibordbij boek

Bewerk uw eigen Digibordbij boek Bewerk uw eigen Digibordbij boek Naast de presentatie van schoolboeken in het Digibordbij systeem is het voor leraren ook mogelijk aanpassingen te maken in de digitale boeken. De leraar kan via een aparte

Nadere informatie

Introductie testtooling Wink

Introductie testtooling Wink Introductie testtooling Wink SYSQA B.V. Almere Datum : 10-04-2013 Status : 1.0 Opgesteld door : Organisatie SYSQA B.V. Pagina 2 van 16 Inhoudsopgave 1 Inleiding... 3 1.1 Opbouw... 3 2 Wink... 4 2.1 Wat

Nadere informatie

Technische data. Versie dec

Technische data. Versie dec Technische data Versie dec.2016 www.mobilea.nl Mobiléa Infrastructuur: Pagina 1 Pagina 2 Specificaties: Het platform van Mobiléa valt op te splitsen in een aantal technische componenten, te weten: De webapplicatie

Nadere informatie

Werking van de Office Connector, en het oplossen van fouten.

Werking van de Office Connector, en het oplossen van fouten. Werking van de Office Connector, en het oplossen van fouten. De Office Connector zorgt ervoor dat de Microsoft Officeomgeving gebruikt kan worden als ontwerp en genereeromgeving voor documenten waarbij

Nadere informatie

Deze handleiding geldt voor Joomla 3.x. In andere versies zijn kleine afwijkingen mogelijk. Copyright 2016 Websitebron.

Deze handleiding geldt voor Joomla 3.x. In andere versies zijn kleine afwijkingen mogelijk. Copyright 2016 Websitebron. Zeer beknopte handleiding Joomla Deze handleiding geldt voor Joomla 3.x. In andere versies zijn kleine afwijkingen mogelijk. Copyright 2016 Websitebron. Waarschuwingen vooraf Pas op: u kunt als eigenaar

Nadere informatie

Het besturingssysteem of operating system, vaak afgekort tot OS is verantwoordelijk voor de communicatie van de software met de hardware.

Het besturingssysteem of operating system, vaak afgekort tot OS is verantwoordelijk voor de communicatie van de software met de hardware. Het besturingssysteem of operating system, vaak afgekort tot OS is verantwoordelijk voor de communicatie van de software met de hardware. Het vormt een schil tussen de applicatiesoftware en de hardware

Nadere informatie

Handleiding CMS. Auteur: J. Bijl Coldfusion Consultant

Handleiding CMS. Auteur: J. Bijl Coldfusion Consultant Handleiding CMS Auteur: J. Bijl Coldfusion Consultant Inhoudsopgave 1.0 Inleiding 3 2.0 Introductie CMS en websites 4 3.0 Inloggen in beheer 5 4.0 Dashboard 6 4.1 Bezoekers totalen 6 4.2 Bezoekers 7 4.3

Nadere informatie

Kenmerken Nomadesk Software

Kenmerken Nomadesk Software Kenmerken Nomadesk Software DATABEVEILIGING Versleutelde lokale schijf Nomadesk creëert een veilige virtuele omgeving, een Vault, op uw lokale harde schijf. Alle mappen en bestanden opgeslagen op de Vault

Nadere informatie

HTML Graphics. Hans Roeyen V 3.0

HTML Graphics. Hans Roeyen V 3.0 HTML Graphics Hans Roeyen V 3.0 19 maart 2015 Inhoud 1. HTML5 Canvas... 3 1.1. Het Canvas element... 3 2. SVG Element... 9 2.1. SVG vergeleken met Canvas... 9 2.2. Een cirkel tekenen met SVG... 10 2.2.1.

Nadere informatie

Versie 2. Opdracht deel B 07-12-2014. Inhoud. Raoul Vos Hogeschool Leiden Studentnummer: 1088675

Versie 2. Opdracht deel B 07-12-2014. Inhoud. Raoul Vos Hogeschool Leiden Studentnummer: 1088675 Versie 2 07-12-2014 Opdracht deel B Inhoud Raoul Vos Hogeschool Leiden Studentnummer: 1088675 Inhoudsopgave: Inleiding:... 3 Opdracht deel A Analyse... 3 Opdracht deel B Inhoud... 3 Opdracht deel C Website...

Nadere informatie

Dit artikel is gepubliceerd in DZone Magazine, januari 2004, pagina 61-63

Dit artikel is gepubliceerd in DZone Magazine, januari 2004, pagina 61-63 Streaming Media Deel 2 Door dr.ir. Al-Noor Ladhani, Forward Thinking BV Januari 2004 Dit artikel is gepubliceerd in DZone Magazine, januari 2004, pagina 61-63 Dzone Magazine is het vaktijdschrift voor

Nadere informatie

Release nieuwe versie 1.9.3

Release nieuwe versie 1.9.3 Release nieuwe versie 1.9.3 November 2013 www.siteop.mobi www.siteop.mobi - Kingsfordweg 151-1043 GR Amsterdam Tel: 085 40 123 92 - support.siteop.mob Release Versie Item Versie Datum SiteOpMobi Platform

Nadere informatie

Meer Winst Met Je Website MEER WINST MET JE WEBSITE!

Meer Winst Met Je Website MEER WINST MET JE WEBSITE! MEER WINST MET JE WEBSITE! Wat is het doel van jouw website? Wat wil je dat de bezoekers doen? En doen ze dat nu ook? Of kijken ze doelloos rond om daarna weer te verdwijnen. Vandaag gaan we kritisch naar

Nadere informatie

Werken met afbeeldingen in webpagina's

Werken met afbeeldingen in webpagina's Werken met afbeeldingen in webpagina's In webpagina's komen heel vaak afbeeldingen voor. Toch gaan webpagina's helemaal anders om met afbeeldingen dan bijvoorbeeld een PowerPoint-presentatie of een Word-document.

Nadere informatie

MyMediasite Handleiding 2013 - V1.0

MyMediasite Handleiding 2013 - V1.0 MyMediasite Handleiding 2013 - V1.0 1 INHOUDSOPGAVE 1. INSTALLATIE 3 2.1 OPNEMEN: OPSTARTEN 4 2.2 OPNEMEN: NIEUWE PRESENTATIE 5 2.3 OPNEMEN: OPNAME PROCES 7 2.4. OPNEMEN: EIGEN MEDIA UPLOADEN 11 3. PRESENTATIE

Nadere informatie

DrICTVoip.dll v 2.1 Informatie en handleiding

DrICTVoip.dll v 2.1 Informatie en handleiding DrICTVoip.dll v 2.1 Informatie en handleiding Nieuw in deze versie : Koppeling voor web gebaseerde toepassingen (DrICTVoIPwebClient.exe) (zie hoofdstuk 8) 1. Inleiding Met de DrICTVoIP.DLL maakt u uw software

Nadere informatie

Gebruikershandleiding Contact Connect

Gebruikershandleiding Contact Connect Gebruikershandleiding Contact Connect Inleiding... 2 Introductie... 2 Installeren en in gebruik nemen van Contact Connect... 3 Downloaden... 3 Installeren... 3 Inloggen... 3 Contact Connect Configuratie...

Nadere informatie

WEBSITE SCAN Vrijblijvend advies

WEBSITE SCAN Vrijblijvend advies WEBSITE SCAN Vrijblijvend advies IBAN: NL57ABNA0479025207 Inleiding: Wij hebben uw website op diverse facetten geanalyseerd en hier een bondig rapport voor geschreven. Door het uitvoeren van onderstaande

Nadere informatie

Hoofdstuk 22: Impact maken

Hoofdstuk 22: Impact maken Hoofdstuk 22: Impact maken 22.0 Inleiding In dit hoofdstuk bekijken we hoe je PowerPoint kunt gebruiken om promotie materiaal te creëren. Het legt uit hoe je PowerPoint presentaties kunt gebruiken op een

Nadere informatie

Eigen Widgets in CRM. Introductie. Limitering. Widgets beschikbaar stellen. Tips & Tricks Eigen Widgets in CRM

Eigen Widgets in CRM. Introductie. Limitering. Widgets beschikbaar stellen. Tips & Tricks Eigen Widgets in CRM Tips & Tricks Eigen Widgets in CRM Eigen Widgets in CRM Introductie De WebUI van CRM 7.0 maakt het mogelijk om je eigen widgets te maken en deze in je eigen view te gebruiken. Dat kan door gebruik te maken

Nadere informatie

Kijk eerst in Computer (Mijn Computer) van je werkplek. Welke stationsletters zie je op de PC?

Kijk eerst in Computer (Mijn Computer) van je werkplek. Welke stationsletters zie je op de PC? Korte omschrijving van dit practicum We zullen spelenderwijze ervaren wat enkele van de virtualisatietechnieken inhouden. We gaan aan de slag met een freeware applicatie voor het aanbieden van een gevirtualiseerde

Nadere informatie

Functionele beschrijving: scannen naar van Brug software.

Functionele beschrijving: scannen naar van Brug software. Functionele beschrijving: scannen naar van Brug software. Algemeen Met de KYOCERA scannen naar van Brug Software beschikt u over een efficiënte oplossing om uw documenten te scannen naar het Notarieel

Nadere informatie

De interface van de Audio Narration lijkt nu meer op de vormgeving zoals we die kennen van Storyline. Meerdere blokken zijn vanaf Studio 360 naar

De interface van de Audio Narration lijkt nu meer op de vormgeving zoals we die kennen van Storyline. Meerdere blokken zijn vanaf Studio 360 naar De interface van de Audio Narration lijkt nu meer op de vormgeving zoals we die kennen van Storyline. Meerdere blokken zijn vanaf Studio 360 naar wens los te trekken en te positioneren op het scherm. Daarnaast

Nadere informatie

Bouw snel en eenvoudig een eigen mobile Virtual Reality app

Bouw snel en eenvoudig een eigen mobile Virtual Reality app Bouw snel en eenvoudig een eigen mobile Virtual Reality app Deze handleiding is opgesplitst in twee delen. Deel 1: Hoe gebruik je het Smart2VR CMS? Deel 2: Hoe gebruik je de Virtual Reality app? Deel 1:

Nadere informatie

Een website omzetten naar WordPress

Een website omzetten naar WordPress 1 Een website omzetten naar WordPress Er zijn talloze programma s beschikbaar om websites te maken. In de titels Basisgids Websites maken met WordPress en Websites maken met WordPress voor senioren wordt

Nadere informatie

iphone app - Roll Call

iphone app - Roll Call iphone app - Roll Call Roll Call - iphone App Deze Paxton applicatie is gratis verkrijgbaar in de App Store. Deze applicatie is ontwikkeld om gebruikt te worden op elk ios apparaat versie 5.1 of hoger

Nadere informatie

Concept Deze week hebben wij ervoor gekozen om de tiled display, die rechts van de ESC balie staat, te verbeteren door een interactieve applicatie eraan te verbinden. Op dit moment is het display, alhoewel

Nadere informatie

10. Single Page Applications

10. Single Page Applications WHITEPAPER IN 5 MINUTEN M E I 2 0 1 4 10. Single Page Applications Introductie De wereld verandert snel en gebruikers openen je site of applicatie steeds minder met een traditionele browser. Een site of

Nadere informatie

CURSUS DIGITAAL ATELIER Photoshop/ Illustrator/ Indesign

CURSUS DIGITAAL ATELIER Photoshop/ Illustrator/ Indesign CURSUS DIGITAAL ATELIER Photoshop/ Illustrator/ Indesign EEN DOCUMENT DRUKKLAAR MAKEN A. Waar moet ik absoluut op letten? B. Hoe doe ik dit? 3. Een preflight pakket maken in Indesign 4. Drukklare PDF maken

Nadere informatie

SBO WEBSITES BOUWEN IN 7 STAPPEN

SBO WEBSITES BOUWEN IN 7 STAPPEN SBO WEBSITES BOUWEN IN 7 STAPPEN STAPPENPLAN WEBSITE BOUWEN Online ondernemers behalen drie procent meer omzet dan hun offline collega's, zo blijkt uit onderzoek. Een goede reden om als mkb er online aanwezig

Nadere informatie

Zoekmachine Optimalisatie (SEO)

Zoekmachine Optimalisatie (SEO) Zoekmachine Optimalisatie (SEO) Dit ebook wordt u geheel gratis aangeboden door Usense - Dé Online Marketing Specialist. Zoekmachine Optimalisatie Zoekmachine optimalisatie, oftewel SEO, gaat over het

Nadere informatie

Functionele beschrijving: scannen naar Exact Globe.

Functionele beschrijving: scannen naar Exact Globe. Functionele beschrijving: scannen naar Exact Globe. Algemeen Met de KYOCERA scannen naar Exact Globe beschikt u over een efficiënte oplossing om uw documenten te scannen naar Exact Globe. Met deze oplossing

Nadere informatie

Gebruikersdocumentatie Onderwijsbank Huisartsgeneeskunde

Gebruikersdocumentatie Onderwijsbank Huisartsgeneeskunde Inleiding Dit document beschrijft de onderwijsbank voor normale gebruikers (gasten, aios en opleiders). De vernieuwde onderwijsbank is in 2011 geïntroduceerd binnen nadat het voorgaande systeem in vergetelheid

Nadere informatie

01/05. Websites Nederland over. Mobile marketing. Whitepaper #03/2013. Mabelie Samuels internet marketeer

01/05. Websites Nederland over. Mobile marketing. Whitepaper #03/2013. Mabelie Samuels internet marketeer 01/05 Websites Nederland over Mobile marketing Mabelie Samuels internet marketeer 02/05 Mobile marketing Kunt u zich uw eerste mobiele telefoon nog herinneren? Die van mij was een Motorola, versie onbekend,

Nadere informatie

Bijlage: Casus 2: Technisch Ontwerp CD-Dom / Mijn Domplein.

Bijlage: Casus 2: Technisch Ontwerp CD-Dom / Mijn Domplein. Bijlage: Casus 2: Technisch Ontwerp CD-Dom / Mijn Domplein. CASUS: Content van de CD dom verwerken in: - Website van Initiatief domplein - Website van Mijn domplein DATUM: 26-05-2009 Versie 2 DOOR: Arnout

Nadere informatie

Via methodewebsite www w.emma.eisma.nl of de ELO van de school

Via methodewebsite www w.emma.eisma.nl of de ELO van de school Via methodewebsite www.emma.eisma.nl of de ELO van de school Veelgestelde vragen rondom de online leerlingomgeving Veelgestelde vragen rondom de online leerlingomgeving (Station, Library en Route 2F) servicedesk@eisma.nl

Nadere informatie

Werkomgeving. Android Studio. Android - werkomgeving 1/6

Werkomgeving. Android Studio. Android - werkomgeving 1/6 Android - werkomgeving 1/6 Werkomgeving Android Studio Installatie Ga naar de volgende URL: http://developer.android.com/sdk/index.html Klik op de knop "Download Android Studio for Windows" om het programma

Nadere informatie

Radio Holland Group B.V. Cookie Policy websites NL

Radio Holland Group B.V. Cookie Policy websites NL Radio Holland Group B.V. Cookie Policy websites NL Effective date 25 May, 2018 Versie 1.1 dd. 28 augustus 2018 1 Inhoudsopgave Cookiebeleid van Radio Holland... 3 Toepasselijkheid... 3 Wat zijn cookies,

Nadere informatie

HANDLEIDING Windows XP Deel 1

HANDLEIDING Windows XP Deel 1 HANDLEIDING Windows XP Deel 1 Bureaublad en Beeldscherm aanpassen Gemaakt door: De Spanjehelpdesk http://www.spanjehelpdesk.nl Voorwoord Windows XP is het besturingssyteem van uw PC. Het besturingssysteem

Nadere informatie

Met React online s eigen Drupal configuratie is websiteonderhoud

Met React online s eigen Drupal configuratie is websiteonderhoud / Met React online s eigen Drupal configuratie is websiteonderhoud super eenvoudig. Drupal 8 snelgids In deze snelgids behandelen we de meest voorkomende functionaliteiten en handelingen die je helpen

Nadere informatie

Inhoudsopgave Disclaimer... 3 Voorwoord... 4 Inleiding... 5 Het downloaden van XAMPP... 7 Het installeren van XAMPP... 8 Joomla installeren op

Inhoudsopgave Disclaimer... 3 Voorwoord... 4 Inleiding... 5 Het downloaden van XAMPP... 7 Het installeren van XAMPP... 8 Joomla installeren op 1 Inhoudsopgave Disclaimer... 3 Voorwoord... 4 Inleiding... 5 Het downloaden van XAMPP... 7 Het installeren van XAMPP.... 8 Joomla installeren op XAMPP... 15 Handige links... 16 2 Disclaimer Bij de samenstelling

Nadere informatie

Algemene WordPress Handleiding uitleg basics Karin de Wit Design

Algemene WordPress Handleiding uitleg basics Karin de Wit Design Inhoudsopgave Inhoudsopgave... 2 Algemene informatie... 3 Introductie... 4 Inloggen bij WordPress... 5 Introductie in het dashboard... 6 Berichten en pagina's... 8 Bericht Categorieën... 8 Nieuw Bericht...

Nadere informatie

Intramed procedure. Intramed en Windows 7. 1. Upgraden naar Windows 7

Intramed procedure. Intramed en Windows 7. 1. Upgraden naar Windows 7 1. Upgraden naar Windows 7 Voorbereiding Als u straks gebruik wilt maken van een applicatie die nu op een andere computer draait, raden wij u aan om voordat u tot de installatie overgaat alle eventuele

Nadere informatie

Mach3Framework 5.0 / Website

Mach3Framework 5.0 / Website Mach3Framework 5.0 / Website Handleiding Mach3Builders Inhoudsopgave 1 Inloggen...5 1.1 Ingelogd blijven...6 1.2 Wachtwoord vergeten...7 2 Applicatie keuzescherm...8 2.1 De beheeromgeving openen...9 3

Nadere informatie

IQ LEADS Adres: Curieweg 8E Postcode: 2408 BZ Plaats: ALPHEN AAN DEN RIJN Telefoon: (0172)

IQ LEADS Adres: Curieweg 8E Postcode: 2408 BZ Plaats: ALPHEN AAN DEN RIJN Telefoon: (0172) 1 Inhoud Tips voor u begint... 3 Beginnen met WordPress... 4 Login... 4 Dashboard... 4 Back-up maken van uw website... 5 Bloggen en Pagina s... 6 Tekst editor... 6 Nieuwsbericht maken (Bloggen)... 6 Pagina

Nadere informatie

Rafra Information Services belgium Rijksweg 22, B-8520 KUURNE Belgium Tel +32(0)56/32.50.27 (3l) Fax +32(0)56/32.50.29

Rafra Information Services belgium Rijksweg 22, B-8520 KUURNE Belgium Tel +32(0)56/32.50.27 (3l) Fax +32(0)56/32.50.29 De RIS Belgium geïntegreerde Statistieken Server Velen hebben een teller of een statistisch programma (Nedstat e.d.) op hun site staan. De Nedstat Pro versie voor bedrijven is een goede uitbreiding voor

Nadere informatie

Whitepaper. Personal Targeting Platform. De juiste content Op het juiste moment Aan de juiste persoon

Whitepaper. Personal Targeting Platform. De juiste content Op het juiste moment Aan de juiste persoon Whitepaper Personal Targeting Platform De juiste content Op het juiste moment Aan de juiste persoon Introductie 2 Geïntegreerde personalisering 2 Het opbouwen van een profiel 2 Segmenteren en personaliseren

Nadere informatie

Net2 kaarten bedrukken

Net2 kaarten bedrukken kaarten bedrukken kaarten bedrukken - Welke methode? Er bevinden zich twee pakketen om kaarten te bedrukken in de software. Een basis vast formaat dat al aanwezig is in de software sinds 2003 (V3.16) en

Nadere informatie

Online Marketing. Door: Annika Woud ONLINE MARKETING

Online Marketing. Door: Annika Woud ONLINE MARKETING Online Marketing Door: Annika Woud 1 Inhoudsopgaven 1 Wat is online marketing? 2 Hoe pas je online marketing toe op een website? Hoe pas je het toe? SEO Domeinnaam HTML Google Analytics Advertenties op

Nadere informatie

Uiterlijk. Lauri Watts Vertaling van het handboek: Niels Reedijk Vertaler/Nalezer: Alexander S. Koning

Uiterlijk. Lauri Watts Vertaling van het handboek: Niels Reedijk Vertaler/Nalezer: Alexander S. Koning Lauri Watts Vertaling van het handboek: Niels Reedijk Vertaler/Nalezer: Alexander S. Koning 2 Inhoudsopgave 1 Uiterlijk 4 1.1 Algemeen.......................................... 4 1.2 Lettertypen..........................................

Nadere informatie

Installatie- en gebruikshandleiding Risicoverevening. 11 april 2007 ZorgTTP

Installatie- en gebruikshandleiding Risicoverevening. 11 april 2007 ZorgTTP Installatie- en gebruikshandleiding Risicoverevening 11 april 2007 ZorgTTP Inleiding In het kader van Risicoverevening wordt gepseudonimiseerd informatie aangeleverd aan het College voor Zorgverzekeringen

Nadere informatie

De Kleine WordPress Handleiding

De Kleine WordPress Handleiding Introductie Dit is geen uitgebreide handleiding om een WordPress website of blog mee te bouwen. Het is ook geen overzicht van alle aspecten die een WordPress website zo bijzonder maken en geen verhandeling

Nadere informatie

Onderzoeksvaardigheden 2

Onderzoeksvaardigheden 2 Performance van Phonegap Naam: Datum: april 2012 Studentnummer: 0235938 Opleiding: CMD Docenten: Pauline Krebbers Modulecode: MEDMO101DT Modulenaam: Onderzoeksvaardigheden 2 / Media & Onderzoek Inhoudsopgave

Nadere informatie

DOCENTENHANDLEIDING JET-NET WEBCAST

DOCENTENHANDLEIDING JET-NET WEBCAST DOCENTENHANDLEIDING JET-NET WEBCAST Inhoudsopgave Inloggen... 3 Layout... 5 Interactie... 6 Benodigdheden... 8 Praktische tips... 8 Bijlage I : HELP... 9 2 Inloggen Om deel te nemen aan de webcast, moet

Nadere informatie

Kompozer Webdesign www.acc.dds.nl/lesonline/kompozer/

Kompozer Webdesign www.acc.dds.nl/lesonline/kompozer/ Hier vind je de cursus op het internet: www.acc.dds.nl/acconline/ Kompozer Webdesign www.acc.dds.nl/lesonline/kompozer/ Een bestaande website met kompozer www.acc.dds.nl/lesonline/kompozer/website/ Bestanden

Nadere informatie

Websitecheck. Taak en Tekst voor websites die werken. www.jouwsite.nl

Websitecheck. Taak en Tekst voor websites die werken. www.jouwsite.nl Taak en Tekst voor websites die werken www.jouwsite.nl Websitecheck Taak en Tekst, www.taakentekst.nl Buijs Ballotstraat 27A, 2563 ZH Den Haag 06-13935470 1 Websitecheck Website: Eigenaar: Datum: www.jouwsite.nl

Nadere informatie

Technologie en Interactie 3.2: software architectuur

Technologie en Interactie 3.2: software architectuur Technologie en Interactie 3.2: software architectuur Manual IAM-TDI-V2-Technologie en Interactie. Jaar 0809 blok 2 Oktober 2008 Fons van Kesteren 1/8 Inhoud Technologie en Interactie 3.2: software architectuur...

Nadere informatie

Inhoud Installatie en Setup... 5 IRISCompressor gebruiken... 13

Inhoud Installatie en Setup... 5 IRISCompressor gebruiken... 13 Gebruikshandleiding Inhoud Introductie... 2 BELANGRIJKE OPMERKINGEN... 2 Juridische informatie... 3 Installatie en Setup... 5 Systeemvereisten... 5 Installatie... 5 Activering... 8 Automatische update...

Nadere informatie

LES 1: AAN DE SLAG MET WORDPRESS. Lesoverzicht: Aan de slag Wat is WordPress CMS Front-end Back-end Samenvatting. Tijd: 5 minuten

LES 1: AAN DE SLAG MET WORDPRESS. Lesoverzicht: Aan de slag Wat is WordPress CMS Front-end Back-end Samenvatting. Tijd: 5 minuten LES 1: AAN DE SLAG MET WORDPRESS Lesoverzicht: Aan de slag Wat is WordPress CMS Front-end Back-end Samenvatting Tijd: 5 minuten Doel: Aan het einde van deze les weet je wat WordPress is en kun je benoemen

Nadere informatie

Handleiding Website Laatste update: april 2014

Handleiding Website Laatste update: april 2014 Laatste update: april 2014 1. Google Search Tijdens de ontwikkeling van uw website werd er veel aandacht besteed aan optimalisatie voor zoekmachines zoals Google. Dit onder andere door de broncode technisch

Nadere informatie

Handleiding Macromedia Contribute

Handleiding Macromedia Contribute Handleiding Macromedia Contribute Marcel Lemmen en Frank Coenders maart 2008 Handleiding Macromedia Contribute 1 Contribute in vogelvlucht Contribute werkt simpel en intuïtief. Het bewerken van een website

Nadere informatie

INTRODUCTIE BELANGRIJKE OPMERKINGEN

INTRODUCTIE BELANGRIJKE OPMERKINGEN Gebruiksaanwijzing INTRODUCTIE IRISCompressor Pro is een handig compressiehulpmiddel waarmee u afbeeldings- en PDF-bestanden in slechts enkele muisklikken kan converteren in gecomprimeerde PDF-bestanden.

Nadere informatie

COLLECTOR GEBRUIKERSHANDLEIDING

COLLECTOR GEBRUIKERSHANDLEIDING COLLECTOR GEBRUIKERSHANDLEIDING We hebben deze gebruikershandleiding voor je samengesteld om je te helpen het beste uit onze tool te halen. Deze handleiding ondersteunt bij het ontwerpen van je eigen peiling

Nadere informatie

Webportal instellingen

Webportal instellingen Inge Heuvel - van Schaijck --- Online Van: Maarten Heuvel - Online Verzonden: vrijdag 20 juni 2014 22:16 Aan: info@onlinegroep.nl Onderwerp: Online Pro Update 2014.0.0.90: Webportal

Nadere informatie

Software is in veel manieren te indelen,meest bekend op grond van :

Software is in veel manieren te indelen,meest bekend op grond van : Hoofdstuk 1 1.1: Softwarecategorieen Software is in veel manieren te indelen,meest bekend op grond van : Taal Platform Manier van bedienen Licentie voor de software Het in in algemeen te gebruiken voor

Nadere informatie