LINKED OPEN DATA De heilige graal voor morgen? Door: Bert ten Brinke
Bert ten Brinke Vanaf 1985 in de IT Vanaf 1990 met GIS bezig Als ontwikkelaar, ontwerper, consultant, projectleider, interim manager Sinds 2008 bij Nieuwland Geo-Informatie 11/24/2014 Linked Open Data 2
Het gebruik van Linked (Open) Data geeft enorme mogelijkheden om gegevensverzamelingen te ontsluiten en te koppelen via het web, iets waar we bij de ontwikkeling van de Laan van de Leefomgeving een enorme behoefte aan zullen hebben 11/24/2014 Linked Open Data 3
Inleiding: Laan voor de Leefomgeving Wordt onderdeel van de invoering van de nieuwe omgevingswet De nieuwe omgevingswet beoogt de huidige versnipperde wetgeving rondom milieu en ruimtelijke ordening te stroomlijnen en in 1 nieuwe wet onder te brengen. Van 2013-2017: Invoering stelselherziening omgevingsrecht Realiseren van een databank met ruimtelijke gegevens De locatie zal een belangrijke rol spelen en ook in de wet verankerd worden. Dus de Laan krijgt een flinke koppeling met GIS Video Laan van de Leefomgeving 11/24/2014 Linked Open Data 4
Stelling 1 Zonder Open data kunnen we een goede werking voor de Laan van de Leefomgeving wel vergeten! 11/24/2014 Linked Open Data 5
Open data Momenteel zijn er goede, betere en uitstekende voorbeelden PDOK Inspire BAG CBS-dataverzamelingen Nederlandse wetgeving Strooiroutes Vuilophaaldiensten Zie b.v: http://www.gemgids.nl/nieuws/ambtenaar-19-helpt-utrecht-opent-data/ Zie ook: http://www.utrechtopendata.org/datasets/ 11/24/2014 Linked Open Data 6
Wat is Open data De data is openbaar; Er berust geen auteursrecht of andere rechten van derden op; De data zijn bekostigd uit publieke middelen (OSM?), beschikbaar gesteld voor de uitvoering van die taak; De data voldoen bij voorkeur aan open standaarden (geen barrières voor het gebruik door ICT-gebruikers of door ICT-aanbieders); Open Data is bij voorkeur computer-leesbaar, zodat zoekmachines informatie in documenten kunnen vinden. Bron: https://data.overheid.nl/ 11/24/2014 Linked Open Data 7
Open data voor de Laan: Waarom? Iedereen toegang tot dezelfde info: Vergunningaanvrager Vergunningverlener Belanghebbende Doel Bepaling vooraf haalbaarheid van de vergunning Besparing teleurstellingen Onnodig werk overheid voorkomen Transparantie van het proces Tijdens het proces Toetsing achteraf 11/24/2014 Linked Open Data 8
Bedreigingen voor Open Data Actualiteit van de data (zal zich wel oplossen) Kwaliteit van de dataset Kwaliteit van de data Kwaliteit van de metadata 11/24/2014 Linked Open Data 9
Stelling 2 Zonder Linked data kunnen we een goede ontsluiting voor de Laan van de Leefomgeving wel vergeten! Het gebruik van Linked (open) data geeft enorme mogelijkheden om gegevensverzamelingen te ontsluiten en te koppelen iets waar we, volgens mij, bij de ontwikkeling van de Laan van de Leefomgeving een enorme behoefte aan zullen hebben 11/24/2014 Linked Open Data 10
Linked data Linked data gaat over het gebruik van het WWW om gerelateerde data te koppelen die voorheen niet was gekoppeld, of om het WWW te gebruiken om de barrières te verminderen die er met de huidige methoden van koppelen wel zijn. Gebruikte benamingen: WEB 3.0 of Semantische web 11/24/2014 Linked Open Data 11
Linked data: Semantiek Semantiek betekent letterlijk betekenisleer Wetenschap die zich bezighoudt met de betekenis van symbolen en in het bijzonder van taal Hier ligt ook de grootste uitdaging bij het koppelen van data die voorheen niet gekoppeld was!! 11/24/2014 Linked Open Data 12
Stelling 3. Open Data is waardeloos als er geen semantiek bij geleverd wordt! Dus de meeste Open Data is waardeloos! 11/24/2014 Linked Open Data 13
Semantiek bij informatici Opstellen informatiemodel door architecten: Meestal keurig datamodel inclusief de betekenis Uitwerking door techneuten: Hier verdwijnt de betekenis en wordt het model aangepast aan de technische beperkingen van de gebruikte omgeving 11/24/2014 Linked Open Data 14
Linked Data: Overige termen Thesaurus Taxonomie Ontologie Technisch vocabulair RDF Triples (Geo)SPARQL JASON-LD OWL/Dublin core 11/24/2014 Linked Open Data 15
Linked Data: Thesaurus Een geordende verzameling woorden of woordgroepen, waarvan de vorm en de onderlinge hiërarchische en andere semantische relaties zijn vastgelegd. 11/24/2014 Linked Open Data 16
Linked Data: Thesaurus term broader term narrower term alternatieve term verfkwasten Borstels Preferred parent biespenselen goudstoffers harpuiskwasten lakkwasten rolverfborstels spalters teerkwasten verfkwasten met reservoir Waterverfkwasten Verfkwast related term Schilderspenselen scope note Kwasten die worden gebruikt om verf aan te brengen als deklaag op grote of tamelijk grote oppervlakken. Gebruik 'schilderspenselen' voor kleine kwasten die zijn gemaakt om met precisie verf of inkt aan te brengen. facet Objecten termtype Voorkeursterm record type Concept concept id 300022385 used for kwasten (schildersgereedschap) bron Van Dale Engels-Nederlands (1989) Nieuwland Geo-Informatie Bron: Art & Architecture Thesaurus 11/24/2014 Linked Open Data 17
Linked Data: Taxonomie De wetenschap van het indelen van individuen of objecten in groepen Daartoe wordt gebruikgemaakt van gestandaardiseerde definities van begrippen, waarbij de begrippen in een subtype-supertype hiërarchie of taxonomie gerangschikt worden. Deze structuur heeft onder andere als groot voordeel dat eigenschappen van supertypen geërfd worden door de subtypen. Hier komt de object oriëntatie om de hoek kijken Een object kan in verschillende klassen onderverdeeld worden: 1. Dieren naar hun biologische indeling 2. Dieren naar een indeling eetbaar/niet eetbaar 11/24/2014 Linked Open Data 18
Linked Data: Ontologie Een Ontologie beschrijft de eigenschappen, of breder: het zijn van het geheel van dingen, "entiteiten" of ook zijnden genoemd, waarvan aangenomen wordt dat ze bestaan of beter: zijn. (afkomstig uit de filosofie) Het betreft hun aard, eigenschappen, rangorde en onderlinge betrekkingen. Binnen het semantisch web moet een computer de betekenis van tekst en metadata kunnen afleiden en op basis van die betekenis kunnen redeneren en gevolgtrekkingen maken. For the web, ontology is about the exact description of web information and relationships between web information Hier komt de kunstmatige intelligentie om de hoek kijken 11/24/2014 Linked Open Data 19
Welke hulpmiddelen hebben we hiervoor? 11/24/2014 Linked Open Data 20
GeoNames Alternate Names or Name Variants Name Language Code Bois-le-Duc fr French Bolduque es Spanish Boscoducale it Italian Den Bos fy Western Frisian Den Bosch nl Dutch Hertogenbosch pl Polish Hertogenbosch Herzogenbusch de German http://en.wikipedia.org/wiki/ s- Hertogenbosch link Oeteldonk nl Dutch link to website 's Bosch abbr abbreviation 's-hertogenbosch nl Dutch s-hertogenbosch no Norwegian Silva Ducis la Latin Хертогенбос ru Russian 's-hertogenbosch ca. 3 m 's Bosch,Bois-le-Duc,Bolduque,Boscoducale,Den... Netherlands» North Brabant» Gemeente 's-hertogenbosch seat of a first-order administrative division population : 134520 N 51 41' 57'' E 5 18' 15'' 51.69917 / 5.30417 IDGeoNameId : 2747351 Hierdoor wordt het mogelijk teksten te classificeren uit verschillende landen of verschillende landstreken en deze aan elkaar te relateren 11/24/2014 Linked Open Data 21
Stelling 4 Informatie architecten moeten bij het opzetten van modellen tevens rekening houden met bestaande thesauri, taxonomieën en ontologiën en daarnaar verwijzen! Dit kost in het begin wat meer tijd maar levert naar de toekomst een enorme meerwaarde. 11/24/2014 Linked Open Data 22
Technische termen (W3C standaarden) RDF = Resource description framework Triples Onderwerp Predicaat Object (Geo)SPARQL (opvraagtaal, dus ook voor GIS) JASON/LD (extensie op JASON om metadata mee te zenden, ook in de GISwereld een standaard) DUBLIN core: Metadata standaard om content op het web mee te beschrijven OWL: Ontology Web Language. XML taal om kennissystemen mee op te zetten 11/24/2014 Linked Open Data 23
Stelling 5 Door de W3C standaarden op het gebied van Linked Data is dit inmiddels een volwassen technologie en kan dus zonder problemen gebruikt worden. 11/24/2014 Linked Open Data 24
Nu terug naar de Laan 11/24/2014 Linked Open Data 25
Per informatiehuis Grote verscheidenheid aan data Sommige delen zijn goed gestructureerd anderen maar matig Het gebruik van gegevens, zowel de wijze als het aantal, veranderd in de tijd Zijn er diverse leveranciers Zoveel mogelijk inclusief de locatiegegevens (GIS-component) Dit vraagt: Flexibele architectuur en opzet, die toekomstbestendig is 11/24/2014 Linked Open Data 26
De laan vraagt om: Een flexibele structuur om diverse vragen aan te kunnen. Er zal een groot deel vaste voorgedefinieerde vragen zijn, die snel en eenduidig zijn op te lossen, maar er zal ook een flink aantal complexere vragen zijn die om flexibiliteit vragen. 11/24/2014 Linked Open Data 27
Maar we moeten: Ervoor zorgen dat we allemaal dezelfde taal spreken Onze metadata op orde krijgen en houden Nieuwe methoden ontwikkelen om kwaliteit van data eenvoudig, snel en objectief te kunnen beoordelen. Nieuwe technologieën zoals Linked Data stimuleren en eventueel verplicht voorschrijven 11/24/2014 Linked Open Data 28
Stelling 6 De Laan kan niet zonder Open Data! De Laan kan niet zonder Linked Data! De Laan kan niet zonder Linked Open Data! 11/24/2014 Linked Open Data 29
Waar kunnen we nu al mee starten Opstellen informatiemodel door architecten: Meestal keurig datamodel inclusief de betekenis Uitwerking door techneuten: De betekenis van de data en de verwijzing naar thesauri, taxonomieën en ontologiën blijft in stand 11/24/2014 Linked Open Data 30
Zodat we straks weten: Wat de betekenis van de data is Welke data beschikbaar is Wat de kwaliteit van de data is en we met z n allen tot een betere vergunningverlening komen maar ook de kennis en ervaring hebben om echt met open data aan de slag te gaan 11/24/2014 Linked Open Data 31
Vragen? 11/24/2014 Linked Open Data 32
11/24/2014 Linked Open Data 33