Catalogus van instrumenten voor semantische interoperabiliteit Deliverable D3

Maat: px
Weergave met pagina beginnen:

Download "Catalogus van instrumenten voor semantische interoperabiliteit Deliverable D3"

Transcriptie

1 INTEGRATE Fase 1 Catalogus van instrumenten voor semantische interoperabiliteit Deliverable D3 Datum: 24 september 2008 Versie: 1.11 Auteur(s): Rogier Brussee (Telematica Instituut), Matthijs Punter (TNO), Jasper Roes (TNO) Opdrachtgever(s): Stichting Kennisnet, Forum Standaardisatie, TNO Informatie- en Communicatietechnologie, Telematica Instituut

2 INTEGRATE-project Postbus AN Enschede +31 (0) Colosseum PV Enschede +31 (0) De Creative Commons Naamsvermelding-Niet-commercieel 3.0 Nederland Licentie is van toepassing op dit werk. Ga naar of stuur een brief naar Creative Commons, 171 Second Street, Suite 300, San Francisco, California, 94105, VS om deze licentie te bekijken.

3 3 / 63 Inhoudsopgave 1 Inleiding Doelstelling Aanpak Leeswijzer Definities en onderzoeksvraag Definitie semantische interoperabiliteit Definitie semantisch model Definitie semantische interoperabiliteitsprobleem Hoofdvraag en subvragen Gebruik instrument Beslisboom Suggesties voor antwoorden Boom Semantische modellen Vergelijkingstabel Strings Gecontroleerd vocabulaire Thesaurus Taxonomie Metadata schema Gegevenscatalogus Ontologie Object gebeurtenismodel Stappenplan voor ontwikkeling semantisch model Inleiding Beschikbare methoden Stappenplan Checklist voor beheer van semantische modellen Inleiding Beheergebieden Beheergebieden gekoppeld aan semantische modellen Checklist Tooling Tools Overzichtstabel tools en mogelijkheden Conclusies en aanbevelingen Conclusies Aanbevelingen Referenties... 59

4 4 / 63 Bijlage(n) A Bestaande modellen voor inrichting van de beheergebieden B EDEX NTA C Uitwerking processen SETU case

5 5 / 63 1 Inleiding Het delen van informatie en het koppelen van bedrijfsprocessen, binnen maar vooral ook tussen organisaties in ketens en netwerken, wordt meer en meer een noodzakelijke voorwaarde voor levensvatbaar commercieel handelen (in het bedrijfsleven) en voor het effectief aanpakken van maatschappelijke uitdagingen (voor de overheid). Tegelijkertijd bestaat er geen professioneel vak Interoperabiliteit waarmee deze uitdaging kan worden aangepakt. Zo hier en daar zijn technische en organisatorische ingrediënten wel versnipperd bekend of aanwezig, maar wordt het wiel steeds opnieuw uitgevonden. Andere onderdelen van het vak ontbreken nog grotendeels. Binnen de eerste fase van het project worden door het Telematica Instituut, TNO Informatie- en Communicatietechnologie, Kennisnet en Forum Standaardisatie een drietal instrumenten ontwikkeld die gebruikt kunnen worden om specifieke interoperabiliteitsproblemen aan te pakken, te weten: Instrumenten voor business case analyses voor interoperabiliteit, Kwaliteitsraamwerk voor standaarden en de Catalogus van instrumenten voor semantische interoperabiliteit. Dit document beschrijft de één van de drie instrumenten, de catalogus van instrumenten voor semantische interoperabiliteit. In dit document worden instrumenten gedefinieerd die gebruikt kunnen worden bij het bereiken van semantische interoperabiliteit tussen twee samenwerkende partijen. 1.1 Doelstelling Bij het uitwisselen van informatie tussen twee samenwerkende partijen is er regelmatig onduidelijkheid over de betekenis van de informatie die uitgewisseld wordt. De instrumenten die beschreven worden in dit document dragen bij aan het helder definiëren van de betekenis van de informatie die uitgewisseld wordt waarmee de interoperabiliteit tussen twee samenwerkende partijen versterkt wordt. Om het bereiken van semantische interoperabiliteit tussen twee samenwerkende partijen te ondersteunen definieert dit document een vijftal instrumenten: Beslisboom: Als instrument te gebruiken voor het maken van een keuze tussen semantische modellen voor het vastleggen van de betekenis van informatie die uitgewisseld wordt tussen twee samenwerkende partijen. Definities van semantische modellen: Te gebruiken als instrument voor het verkrijgen van inzicht in de semantische modellen. De definities van de volgende acht semantische modellen worden gegeven: Strings Vocabulaire Thesaurus Taxonomie Metadata schema Gegevenscatalogus Ontologie Object gebeurtenismodel

6 6 / Aanpak Stappenplan voor het ontwikkelen van een semantisch model: Als instrument te gebruiken bij het ontwikkelen van een semantisch model voor het vastleggen van de betekenis van informatie. Checklist voor het inrichten van een organisatie voor het beheer van semantische modellen: Te gebruiken als instrument om te controleren of een beheerorganisatie volledig is en om te dienen als lijst van benodigde zaken bij het inrichten van een beheerorganisatie. Overzichtstabel met tooling voor ondersteuning van ontwikkeling en beheer van semantische modellen: Te gebruiken als instrument om een tool te vinden die ondersteuning kan bieden bij de ontwikkeling van een semantisch model, of bij het beheer van een semantisch model. De bovenstaande vijf instrumenten kunnen in combinatie gebruikt worden voor het ondersteunen van het proces van de keuze voor een semantisch model, het ontwikkelen van het semantische model en het beheren van een semantisch model. Dit hele document kan daarom zelf ook als een instrument worden beschouwd, waarbij de hierboven beschreven vijf instrumenten onderdeel zijn van het grotere instrument. De toepassing van dit document als instrument wordt toegelicht in paragraaf 2.5. Deze catalogus van instrumenten voor semantische interoperabiliteit wordt ontwikkeld op basis van desk research naar semantische modellen en procesbeschrijvingen rondom het ontwikkelen en beheren van semantische modellen. Omdat dit vakgebied echter nog in de kinderschoenen staat, is er niet direct literatuur gevonden die 1-op-1 betrekking heeft op het onderzoek dat voor dit instrument wordt uitgevoerd. Naast de desk research worden daarom ook casestudies uitgevoerd om te zorgen voor toepasbaarheid van de resultaten. De casestudies komen zowel uit de literatuur als vanuit de partners binnen het project. 1.3 Leeswijzer De opbouw van dit document is als volgt: In hoofdstuk 2 worden de hoofdvraag en de subvragen gepresenteerd waarvoor dit document een antwoord biedt. Hoofdstuk 3 presenteert een beslisboom om te bepalen welk semantische model het meest geschikt is om de informatie bij een interoperabiliteitsprobleem vast te leggen. In hoofdstuk 4 worden een achttal semantische modellen besproken die gebruikt kunnen worden om semantiek vast te leggen. Hoofdstuk 5 beschrijft het proces om een semantisch model te ontwikkelen Hoofdstuk 6 beschrijft de processen waarmee de semantische modellen beheerd kunnen worden. Hoofdstuk 7 geeft een overzicht van tools die beschikbaar zijn om zowel de ontwikkeling als het beheer van semantische modellen te ondersteunen. In het laatste hoofdstuk, hoofdstuk 8, worden conclusies gepresenteerd en worden aanbevelingen gedaan voor vervolgonderzoek.

7 7 / 63 2 Definities en onderzoeksvraag Dit hoofdstuk geeft de definitie van semantische interoperabiliteit die binnen dit instrument gehanteerd wordt. Hiernaast wordt in dit hoofdstuk ook vastgelegd wat de definitie is van een semantisch model en wat het semantische interoperabiliteitsprobleem waar over gesproken wordt precies is. Naast deze definities wordt de hoofdvraag, en de daaraan gerelateerde subvragen welke in dit instrument worden beantwoord gepresenteerd. 2.1 Definitie semantische interoperabiliteit Semantische interoperabiliteit betekent dat samenwerkende partijen aan gegevens, die uitgewisseld worden, dezelfde betekenis toekennen. Soms verdient het de voorkeur om deze betekenis van gegevens expliciet vast te leggen in een afspraak, een semantische interoperabiliteitsafspraak. Het vastleggen van de gegevens binnen de semantische interoperabiliteitsafspraak kan met behulp van de semantische modellen die in dit document worden beschreven. Semantische interoperabiliteit is niet gelijk aan syntactische interoperabiliteit. Waar het bij semantische interoperabiliteit gaat om het vastleggen van de betekenis van gegevens, gaat het bij syntactische interoperabiliteit om het vastleggen van de schrijfwijze (vorm of syntax) van de gegevens. Als voorbeeld van syntactische interoperabiliteit, waarbij de syntax wel expliciet is vastgelegd maar de semantiek niet, zou er gekeken kunnen worden naar een kommagescheiden bestand. Stel het bestand ziet er als volgt uit: Henk;Pietersen;ja;Molenweg;5;6543AB;Amsterdam Jan;Janssen;ja;Boomstraat;89;5124GH;Rotterdam Klaas;Franssen;nee;Amsterdamseweg;173;3645TG;Almere In het bovenstaande voorbeeld is alleen de syntax beschreven van de informatie die uitgewisseld wordt. De afspraak hierbij is dat ieder gegeven bestaat uit zeven aparte delen, die worden gescheiden door een puntkomma. De semantiek is in bovenstaand voorbeeld niet vastgelegd. Voor de meeste mensen die bovenstaand voorbeeld zien is het niet moeilijk om de semantiek uit bovenstaande lijst af te leiden. De meeste mensen zullen al snel concluderen dat het gaat om persoonsgegevens, waarbij de voornaam, achternaam, adres, postcode en plaats zijn vastgelegd. Echter, voor computers is dit niet zomaar af te leiden. Tevens zou het ook nog zo kunnen zijn dat niet iedereen dezelfde betekenis toekent aan deze gegevens. De ene persoon zou ervan uit kunnen gaan dat het adres het huisadres van de persoon betreft, een ander persoon zou ervan uit kunnen gaat dat het gaat om het werkadres. Door de beoogde interpretatie van de gegevens ook expliciet vast te leggen kan ervoor worden gezorgd dat hierover eenduidigheid ontstaat. Door de semantiek te documenteren kan er voor gezorgd worden dat iedereen de gegevens op dezelfde manier interpreteert. Het maakt het ook mogelijk om computers de gegevens te kunnen laten interpreteren. Hieronder is hetzelfde voorbeeld wederom opgenomen, alleen is er nu ook semantiek van de gegevens vastgelegd door middel van de eerste regel.

8 8 / 63 Voornaam;Achternaam;Thuisadres;Straat;Huisnummer;Postcode;Plaats Henk;Pietersen;ja;Molenweg;5;6543AB;Amsterdam Jan;Janssen;ja;Boomstraat;89;5124GH;Rotterdam Klaas;Franssen;nee;Amsterdamseweg;173;3645TG;Almere De semantische modellen (een definitie van wat een semantisch model is wordt gegeven in paragraaf 2.2) die in dit document beschreven worden hebben als doel om de semantiek van informatie vast te leggen. Ze zijn niet direct bedoeld om te dienen als uitwisselingsstandaard of als basis om een systeem op te bouwen. Om deze zaken te regelen moet de semantiek uit de modellen gecombineerd worden met een syntactisch model. Samen zorgen deze twee zaken ervoor dat de informatie op een gestandaardiseerde manier uitgewisseld kan worden waarbij de betekenis van de informatie ook eenduidig is vastgelegd. 2.2 Definitie semantisch model De Linguïstische theorie van betekenis 1 is gebaseerd op het werk van [Ogden & Richard, 1923] en [de Saussure, 1986]. Volgens Ullman s theorie, is de betekenis van een woord de associatie van mensen tussen een concept, de referent, dat wil zeggen iets in de realiteit en een woord, dat wil zeggen een teken of symbool. Figuur 1: Ogden-Richard s driehoek We vatten symbool nu meer algemeen op als georganiseerde informatie, en komen tot de volgende definitie: Een semantisch model is een klasse van informatie elementen en de wijze waarop deze informatie is georganiseerd. In de Ogden-Richard driehoek is het semantisch model dus de klasse van symbolen samen met de structuur van deze symbolen. De semantiek van een semantisch model is dan de beschrijving, met andere woorden de correspondentie tussen referent en symbool. Omdat deze gepaard is met conceptuele kennis (aannames, afspraken, procedures, conventies) is de betekenis, de semantiek, van het semantisch model extern aan het model zelf. Verschillende semantische modellen maken het wel mogelijk om verschillende aspecten van de realiteit effectief te beschrijven en vragen daarom meer 1 de z.g. Ullman Driehoek [Ullmann, 1972]

9 9 / 63 of minder gedeelde kennis om met behulp van symbolen uit dit model effectief over de referent te communiceren. 2.3 Definitie semantische interoperabiliteitsprobleem Het semantische interoperabiliteitsprobleem heeft steeds de volgende structuur. Twee partijen willen communiceren over een concept uit de reële wereld. Dit betekent dat beide partijen kennis moeten hebben van die reële wereld, en dat er overeenstemming moet zijn over de manier waarop die wereld wordt beschreven. Deze relatie tussen de manier van beschrijven en de concepten uit de reële wereld worden vastgelegd met een semantisch model. We onderscheiden twee vrijheidgraden voor een semantisch model. De horizontale vrijheid (of dekking), is de mate waarin het model de verschillende te beschrijven concepten kan omvatten. De verticale vrijheidsgraad is de mate van precisie waarin een gegeven beschrijving de reële concepten ook daadwerkelijk vastlegt. Deze vrijheidsgraden kunnen complementair zijn: meer precisie in een model kan ten koste gaan van beperkingen van het domein en meer gedeelde aannames of meer complexiteit om aannames expliciet te maken. Omgekeerd, een grote mate aan omvattendheid of genericiteit kan ten koste gaan van de precisie of vraagt om complexiteit om in expliciete stappen vanuit heel generieke gedeelde aannames verder te specialiseren. Of de dekking en precisie van een semantisch model voldoende zijn, heeft te maken met het doel van de samenwerking, de pragmatiek. 2.4 Hoofdvraag en subvragen De hoofdvraag die in dit document beantwoordt wordt luidt: Hoe ontwerp, beheer en implementeer ik een geschikt semantisch model voor mijn interoperabiliteitsprobleem?. Om deze hoofdvraag te beantwoorden zijn er meerdere subvragen opgesteld. Elk van deze vragen wordt beantwoord in de hoofdstukken die volgen na dit hoofdstuk. We onderkennen de volgende subvragen: Subvraag Hoofdstuk Welk semantische model is het meest geschikt om de betekenis van 3 informatie bij mijn interoperabiliteitsprobleem vast te leggen? Welke semantische modellen bestaan er en wat zijn hun definities? 4 Hoe ontwikkel ik een semantisch model? 5 Hoe richt ik een organisatie in om de semantische modellen te beheren? 6 Welke tooling is beschikbaar om semantische modellen te creëren? 7 Welke tooling is beschikbaar om de ontwikkel- en beheerprocessen te 7 ondersteunen? 2.5 Gebruik instrument Zoals beschreven in het eerste hoofdstuk is het mogelijk om ieder hoofdstuk zelfstandig te gebruiken als instrument. Het is echter ook mogelijk om de instrumenten die in de verschillende hoofdstukken worden gepresenteerd in combinatie te gebruiken. Door de instrumenten te combineren ontstaat er een nieuw instrument, waarbij de kans kleiner is dat er een essentieel onderdeel om semantische interoperabiliteit te bereiken wordt vergeten of overgeslagen.

10 10 / 63 Het stappenplan om de combinatie van instrumenten volledig toe te passen ziet er als volgt uit: 1. Bepaal wat het meest geschikte semantische model is 1a. Doorloop de beslisboom door middel van de vragen 1b. Gebruik de vergelijkings tabel 1. Bepaal wat het meest geschikte semantische model is a. Doorloop de beslisboom door het beantwoorden van de vragen en bepaal wat het meest geschikte semantische model is. b. Indien 1a overgeslagen wordt: Maak als gevorderde gebruiker gebruik van de vergelijkende tabel in hoofdstuk 4 om een keuze te maken. 2. Ontwikkel het semantische model 2a. Gebruik het stappenplan uit hoofdstuk 5 2. Ontwikkel het semantische model a. Gebruik het stappenplan dat beschreven is in hoofdstuk 5 om het semantische model te ontwikkelen. b. Zoek in hoofdstuk 7 tooling op die geschikt is om de ontwikkeling van het semantische model te ondersteunen. 2b. Zoek naar geschikte tooling in hoofdstuk 7

11 11 / Richt het beheerproces in 3b. Geen beheerorganisatie: Richt een beheerorganisatie in 3c. Zoek naar geschikte tooling in hoofdstuk 7 3a. Indien er een beheerorganisatie is: kijk of deze volledig is 3. Richt het beheerproces in a. Indien er al een beheerorganisatie bestaat: bekijk of deze past binnen de beschrijving van het beheerproces zoals beschreven in hoofdstuk 6, en pas waar nodig de beheerorganisatie aan. b. Indien er nog geen beheerorganisatie bestaat: richt een beheerorganisatie in aan de hand van de beschrijving van het beheerproces in hoofdstuk 6. c. Zoek in hoofdstuk 7 tooling op die geschikt is om de beheerorganisatie in te richten of zoek tooling op die geschikt is om het beheerproces te ondersteunen.

12 12 / 63

13 13 / 63 3 Beslisboom In dit hoofdstuk wordt een beslisboom gepresenteerd waarmee aan de hand van vragen die gerelateerd zijn aan eigenschappen van de semantische modellen kan worden bepaald welk semantisch model het meest geschikt is voor het vastleggen van de betekenis van informatie die uitgewisseld wordt tussen twee samenwerkende partijen. Bij deze beslisboom moet wel de kanttekening geplaatst worden dat er voor sommige interoperabiliteitsproblemen meerdere modellen geschikt zijn, en dat de uitkomst van de zoekboom dus niet altijd het enige bruikbare model biedt. In deze gevallen kan de beslisboom gebruikt worden om een eerste schifting te maken tussen de verschillende semantische modellen. 3.1 Suggesties voor antwoorden De beslisboom bevat vragen waarbij het niet altijd even eenvoudig kan zijn om een antwoord op de vraag te geven. Om het beantwoorden van de vragen makkelijker te maken is hieronder een tabel opgenomen met voor iedere vraag suggesties wanneer welk antwoord gegeven zou moeten worden. Tabel 1: Antwoord suggesties beslisboom Vraag Antw. Suggestie Moeten er in het model naast gegevens ook gebeurtenissen vastgelegd kunnen worden? Moeten er in het model gegevens vastgelegd worden, of moet er vastgelegd worden welke informatie er over de gegevens opgenomen kan worden? Zijn er relaties tussen de gegevens, en is het relevant om deze vast te kunnen leggen Gegevens en gebeurtenissen Alleen gegevens Gegevens Informatie over Ja Indien gebeurtenissen van belang zijn in het domein moeten deze opgenomen worden in de modellen. Voorbeeld van een gebeurtenis die van belang is: Het ontvangen van een urenbriefje, dit geeft namelijk aanleiding tot het opstellen en versturen van een factuur. Indien er geen gebeurtenissen zijn die van belang zijn in het domein van de interoperabiliteit is het alleen nodig om gegevens vast te kunnen leggen. Voorbeeld: Het vastleggen van de hiërarchie binnen het dierenrijk. Indien de gegevens zelf opgenomen moeten worden in het model moet dit antwoord gegeven worden. Voorbeeld: Een vastleggen van de opsomming van categorieën voor video s (actie, humor, etc.). Indien de gegevens zelf niet in het model opgenomen moeten worden, maar er alleen vastgelegd moet worden welke informatie er vastgelegd moet worden moet dit antwoord gegeven worden. Een voorbeeld: Bij een video vastleggen dat de titel, leeftijdscategorie en de naam van de regisseur opgenomen moeten worden. Indien er relaties zijn tussen de gegevens en deze zijn ook nodig voor de uitwisselende partijen moeten ze opgenomen worden in de modellen. Voorbeeld: Beide organisaties hebben een andere naam voor extra gemaakte uren op een dag (overwerk en overuren), het is van belang dat in het model is

14 14 / 63 in het model? Zijn de gegevens die vastgelegd moeten worden strikt hiërarchisch? Zijn er meer relaties nodig dan: algemener, specifieker, gerelateerd, synoniem, geprefereerd, context? Is de informatie over de gegevens vast te leggen in één kolom, of zijn er meerder kolommen nodig? Moet de invulling van de gegevens vrij zijn, of moet deze beperkt zijn? Nee Ja Nee Ja Nee Één kolom Meerdere kolommen Vrij Beperkt vastgelegd dat de termen synoniem zijn. Indien er geen relaties zijn, of deze zijn niet relevant voor de uitwisseling. Voorbeeld: Twee organisaties hebben beide volledig hetzelfde begrip en kennis van het domein waardoor het niet nodig is om relaties vast te leggen. Indien de structuur van de gegeven strikt hiërarchisch is, moet hier ja worden geantwoord: Voorbeeld: Het dierenrijk is strikt hiërarchisch georganiseerd en kan dus in een strikte hiërarchie worden vastgelegd. Indien de structuur niet hiërarchisch is, moet hier nee worden geantwoord. Voorbeeld: Uursoorten die bij de ene partij als overuren worden geclassificeerd kunnen bij een ander bedrijf onder de gewone uren worden geclassificeerd. Indien met de genoemde relaties de gegevens die uitgewisseld worden onderling gerelateerd kunnen worden moet hier ja worden geantwoord. Voorbeeld: Lijsten met steekwoorden en personen die gebruikt worden om audiovisueel materiaal te annoteren. Indien er ook andere relaties van belang zijn, moet hier nee worden geantwoord. Voorbeeld: De relatie gemaakt_in die vaak van belang is bij auto onderdelen is geen onderdeel van de genoemde set. Indien de informatie die vastgelegd moet worden uit één term bestaat kan er worden volstaan met één kolom. Voorbeeld: Termen om een video te classificeren bestaan uit één term. Indien de informatie die vastgelegd moet worden bestaat uit meerder termen, zijn er meerdere kolommen benodigd. Bijvoorbeeld het vastleggen van de naam, beschrijving en lengte van een stuk gereedschap. Indien beide partijen dezelfde kennis hebben van het domein, of er niet van tevoren een set met termen opgesteld kan worden kan de invulling van de gegevens vrijgelaten worden. Voorbeeld: Het annoteren van foto s op het internet, iedereen kan er zijn eigen termen aan verbinden. Het antwoord beperkt moet worden gegeven indien er een beperkte lijst moet zijn met mogelijkheden. Voorbeeld: Een beperkte lijst van videogenres.

15 15 / Boom Onderstaande beslisboom kan worden gebruikt om, aan de hand van vragen welke gerelateerd zijn aan eigenschappen van de semantische modellen, te bepalen welk semantisch model het meest geschikt is voor het vastleggen van de betekenis van informatie die uitgewisseld wordt tussen twee samenwerkende partijen. gegevens en gebeurtenissen Moeten er in het model naast gegevens ook gebeurtenissen vastgelegd kunnen worden? alleen gegevens De gegevens en gebeurtenissen worden georganiseerd met behulp van een object-gebeurtenis model. Moeten er in het model gegevens vastgelegd worden, of moet er vastgelegd welke informatie er over de gegevens opgenomen kan worden? informatie objecten over De gegevens die opgenomen kunnen worden wordt vastgelegd in een schema dat de structuur Zijn er relaties tussen de gegevens, en is het relevant om deze vast te kunnen leggen in het model? van de data weergeeft, een metadata schema. Indien de velden in een metadata schema ja nee beperkt moeten worden tot een lijst is het mogelijk om hiervoor een vocabulaire, thesaurus of taxonomie voor te gebruiken. Is de informatie over de gegevens vast te leggen in één kolom, of zijn er meerdere kolommen nodig? meerdere één kolom kolommen Zijn de gegevens die vastgelegd moeten worden strikt hiërarchisch? De gegevens kunnen Moet de invulling van de gegevens volledig ja nee vastgelegd worden een vrij zijn, of moet deze beperkt zijn? gegevenscatalogus. De kolommen in de gegevenscatalogus volledig vrij beperkt kunnen vastgelegd worden met behulp van een De informatie kan vastgelegd worden in metadata schema. een taxonomie. De gegevens kunnen vastgelegd worden in De gegevens kunnen vastgelegd worden in Zijn er meer relaties nodig dan: algemener, specifieker, gerelateerd, synoniem, geprefereerd, context? een string. De invulling van de string is volledig vrij. een gecontroleerd vocabulaire. Er is een vastgestelde lijst met mogelijkheden. ja nee De gegevens kunnen vastgelegd worden in een ontologie. In het bijzonder zal de hiërarchie (meestal) kunnen worden geïnterpreteerd en gecodeerd als een is_een hiërarchie. Andere formele relaties kunnen ook gedefinieerd worden. De gegevens kunnen vastgelegd worden in een thesaurus.

16 16 / 63

17 17 / 63 4 Semantische modellen In dit hoofdstuk wordt in paragraaf 4.1 een vergelijkingtabel gepresenteerd die door de gevorderde gebruiker gebruikt kan worden als vervanging van eerder gepresenteerde beslisboom. In de paragrafen 4.2 tot en met 4.9 worden acht veel gebruikte typen semantische modellen beschreven. De modellen worden daarbij grofweg van modellen met weinig structuur naar modellen met veel structuur beschreven. Per semantisch model worden daarbij de volgende zaken besproken: Definitie, een definitie van het type semantische model, met een korte toelichting Voorbeeld, een voorbeeld van het type semantisch model Gebruik, een situatie waarin dit type semantisch model wordt ingezet Gedeelde kennis, de gedeelde kennis die nodig is om effectief over de realiteit te communiceren bij gebruik van symbolen uit een semantisch model van dit type. Semantiek, de wijze waarop de correspondentie tussen symbool en referent tot stand komt Interoperabiliteit, de wijze waarop het gebruik van dit type semantisch model interoperabiliteit helpt, en wat de inherente valkuilen van het model op interoperabiliteitsgebied zijn. Lopend voorbeeld `video annotatie, de manier waarop het type semantisch model wordt gebruikt binnen de concrete context van het annoteren van video (toevoegen van informatie aan de video s). 4.1 Vergelijkingstabel Deze paragraaf presenteert een vergelijkingstabel voor de semantische modellen. Voordat de tabel gepresenteerd wordt, wordt er aangegeven hoe iedere kolom geïnterpreteerd dient te worden en wat een x in een rij betekend. Gebeurtenissen: Gebeurtenissen slaat op de mogelijkheid om binnen het model gebeurtenissen vast te leggen die van invloed zijn om het interoperabiliteitsprobleem dat opgelost dient te worden. Indien er in deze kolom een x staat kan het model gebeurtenissen vastleggen. Informatie over: Sommige modellen leggen de gegevens vast die van belang zijn voor het interoperabiliteitsprobleem, andere modellen leggen vast welke informatie vastgelegd kan worden over de gegevens. Indien er in deze kolom een x staat legt het model informatie over het object vast. Relaties: Modellen kunnen wel of geen relaties vastleggen tussen objecten. Een x in deze kolom betekent dat het model relaties tussen de gegevens vast kan leggen. Relaties beperkt: Niet alle modellen bieden de mogelijkheid om zelf de relaties te bepalen die vastgelegd worden. Indien in deze kolom een x staat betekend dit dat het model alleen de volgende relaties vast kan leggen: algemener, specifieker, gerelateerd, synoniem, geprefereerd, context. Hiërarchisch: Indien het model dat gebruikt wordt alleen een hiërarchische structuur vast kan leggen staat er in deze kolom een x.

18 18 / 63 Eén kolom: Indien de gegevens die opgeslagen moeten worden in één kolom op te schrijven zijn staat er een x in de kolom. Vrije invulling: Sommige modellen staan toe dat de gegevens die opgenomen worden volledig vrij ingevuld kunnen worden, andere modellen beperkte de mogelijkheden om de gegevens vast te leggen. Indien de gegevens volledig vrij ingevuld kunnen worden bevat deze kolom een x. Tabel 2: Vergelijkingstabel semantische modellen Gebeurtenissen Informatie over Relaties Relaties beperkt Hiërarchisch Eén kolom Vrije invulling Strings x x Gecontroleerd vocabulaire Thesaurus x x Taxonomie x x Metadata schema Gegevenscatalogus Ontologie 4.2 Strings Object Gebeurtenismodel Definitie. Een string is een eindig rijtje karakters uit een alfabet 2. x x Een string is een zeer elementair semantisch model. Andere typen semantische modellen bouwen vaak voort op strings. Voorbeeld. Voorbeelden van strings zijn abc xyz en 123äø. Gebruik. Strings worden overal gebruikt voor vrije tekstuele data. In het bijzonder worden strings gebruikt voor naamgeving. Zulke naamgeving strings kunnen voor mensen leesbaar gekozen worden. De ruimte van (oneindige) strings is oneindig groot en raakt dus nooit uitgeput 3. Tekstuele data zoals door mensen geschreven teksten wordt ook vaak opgevat als een lange string of een verzameling van strings. Computers kunnen strings in grote hoeveelheden verwerken en ongelofelijk snel zoeken naar het voorkomen van een string of string patroon. Ze zijn daarom erg geschikt voor volledige tekst zoekmethoden, met als duidelijkste voorbeeld zoekmachines als Google. Zonder dat Google ook maar iets van teksten begrijpt of aannames hoeft te maken over de woorden die op het internet voorkomen, kan ze toch het grootste deel van het internet indexeren en statistiek opbouwen over teksten en het voorkomen van string patronen zoals woorden en afkortingen. x x 2 De toevoeging alfabet geeft hier aan dat de set van karakters vooraf beperkt is. 3 Voor een string van 8 bit characters met lengte l zijn er 8 l = 2 3l mogelijkheden.

19 19 / 63 Gedeelde kennis. Voor het gebruik van strings als naamgeving is meestal heel weinig gedeelde kennis nodig buiten wereldkennis als het kennen van een naam. Ook voor het gebruik waarbij tekst als verzameling strings wordt opgevat is bijna geen kennis nodig. Dit geldt in het bijzonder voor de makers van software. Een applicatie ontwikkelaar hoeft bijna geen kennis te delen met de gebruiker anders dan gestandaardiseerde keuzes als karakter encoderingen. Daar staat tegenover dat het goed interpreteren van strings heel veel kennis kan vereisen. Een duidelijk voorbeeld is de manier waarop mensen als string gecodeerde woorden en grammatica gebruiken. Ook veel computertoepassingen kennen een zelfde soort gelaagdheid waarbij een veel ingewikkelder semantisch model is gecodeerd als tekst. Semantiek. Semantisch worden strings meestal gebruikt voor naamgeving van willekeurige referenten, inclusief gebruik als naamgeving voor informatie objecten als files of webpagina s. In de laatste gevallen gebruiken we dan echter vaak strings met een iets ingeperkte vorm zoals Merk op dat dezelfde referent verschillende namen kan hebben. Strings worden ook veel gebruikt voor het zoeken in teksten in natuurlijke taal. De semantiek van de string in een zoekopdracht is dan dat een zoekmachine al die teksten teruggeeft die deze zoek string bevatten. Google is daar een goed voorbeeld van. Interoperabiliteit. Strings zijn van belang voor semantische interoperabiliteit omdat voor veel toepassingen heel weinig specifieke gedeelde kennis nodig Als er geen expliciete afspraken hoeven te worden gemaakt over betekenis of notatie, maakt dit het gebruik van strings zeer breed toepasbaar. Voor veel naamgeving toepassingen kan worden vertrouwd op algemeen aanwezige wereldkennis over de naam van reëel bestaande objecten. De naam is belangrijke informatie over een object en vaak de ingang tot verdere informatie. Juist omdat strings zo eenvoudig zijn is op dit niveau tot standaardisatie te komen en het voorkomen van strings in teksten of databases effectief te checken. Strings hebben een grote dekkingsgraad (d.w.z. hebben een grote horizontale vrijheidsgraad: De referenten die door naamgeving met strings worden afgedekt vallen in wezen samen met de mogelijkheid van mensen om dingen te benoemen. Deze grote vrijheid levert ook problemen op. Gebruikers die content taggen met een vrije string zullen naast overwegend correct gespelde onderwerp woorden als Economie ook woorden gebruiken die een affect uitdrukken als interessant of woorden die alleen in de context van de gebruiker zin hebben als Scriptie. De grote vrijheid van het gebruik van strings leidt inherent tot een grotere variabiliteit en daarmee verminderde recall. Vrijheid lijdt ook tot het gebruik van woorden met een grotere ambiguïteit (dat wil zeggen een grote verticale vrijheidsgraad) en daarmee verminderde precisie Voor een preciezere interpretatie van een string, is meestal niet expliciet aanwezige contextinformatie nodig. Als gevolg hiervan is het zoeken naar de betekenis van teksten met behulp van strings een weinig precieze aangelegenheid. Om na te gaan of op het internet iets te vinden is

D2: Kwaliteitsraamwerk voor standaarden

D2: Kwaliteitsraamwerk voor standaarden Nederlandse Organisatie voor toegepast-natuurwetenschappelijk onderzoek / Netherlands Organisation for Applied Scientific Research Colosseum 27 7521 PV Enschede TNO-rapport www.tno.nl T +31 53 483 52 00

Nadere informatie

Beheer- en OntwikkelModel voor Open Standaarden (BOMOS) versie 2 - DEEL 1: DE BASIS

Beheer- en OntwikkelModel voor Open Standaarden (BOMOS) versie 2 - DEEL 1: DE BASIS Beheer- en OntwikkelModel voor Open Standaarden (BOMOS) versie 2 - DEEL 1: DE BASIS Een standaard die niet beheerd wordt is geen standaard! Het is nooit te vroeg om de mogelijkheden voor het beheer van

Nadere informatie

Site Management Handleiding. Onderhouden en beheren van een door Smartsite aangedreven site Release 5.3 Manual-versie 1.0

Site Management Handleiding. Onderhouden en beheren van een door Smartsite aangedreven site Release 5.3 Manual-versie 1.0 Site Management Handleiding Onderhouden en beheren van een door Smartsite aangedreven site Release 5.3 Manual-versie 1.0 Copyright 2010 Seneca B.V. Alle rechten voorbehouden. Niets uit deze uitgave mag

Nadere informatie

Workshop Metadata, Ontologieën en het Semantische Web

Workshop Metadata, Ontologieën en het Semantische Web Workshop Metadata, Ontologieën en het Semantische Web 1. Inleiding In de hedendaagse informatiemaatschappij is de digitalisering van erfgoedcollecties van prioritair belang geworden en maakt het deel uit

Nadere informatie

Eindrapport UNETO-VNI/Webinars

Eindrapport UNETO-VNI/Webinars Ongerubriceerd Kampweg 5 Postbus 23 3769 ZG Soesterberg TNO-rapport TNO-DV 2009 C271 Eindrapport UNETO-VNI/Webinars www.tno.nl T +31 34 635 62 11 F +31 34 635 39 77 info-denv@tno.nl Datum juli 2009 Auteur(s)

Nadere informatie

De Oracle Customer Data Hub als Customer Knowledge Management-applicatie?

De Oracle Customer Data Hub als Customer Knowledge Management-applicatie? De Oracle Customer Data Hub als Customer Knowledge Management-applicatie? Een vergelijkend onderzoek tussen de Customer Data Hub en de eisen en wensen die een organisatie stelt met betrekking tot de functionele

Nadere informatie

Informatiestructuren voor websites

Informatiestructuren voor websites Informatiestructuren voor websites De invloed van de presentatie van onderliggende structuren op het vinden van taalkwesties Masterscriptie Manon Yassa m.yassa@uvt.nl (638165) Begeleider: Dr. M.M. van

Nadere informatie

Evaluatie Nederlandse overheid referentie architectuur

Evaluatie Nederlandse overheid referentie architectuur Evaluatie Nederlandse overheid referentie architectuur Uitvoering van de Globale fase ing. D.S. (David) Campbell Auteurs: ing. R.P. (Robin) van t Wout P.J. (Paul) van Vlaanderen, BICT Plaats: Nijmegen

Nadere informatie

Whitepaper. Richtlijnen voor procesmodelleren Competence Center Requirements & Analysis

Whitepaper. Richtlijnen voor procesmodelleren Competence Center Requirements & Analysis Whitepaper Richtlijnen voor procesmodelleren Competence Center Requirements & Analysis Hoofdkantoor Kruisboog 42 3905 TG Veenendaal Tel. +31(0)318-55 20 20 Fax +31(0)318-55 23 55 Kenniscentrum De Smalle

Nadere informatie

ArchiMate in de praktijk. Modelleren volgens ArchiMate aan de hand van een verzameling good practices

ArchiMate in de praktijk. Modelleren volgens ArchiMate aan de hand van een verzameling good practices ArchiMate in de praktijk Modelleren volgens ArchiMate aan de hand van een verzameling good practices Colofon Titel : ArchiMate in de Praktijk Datum : 2 februari 2012 Versie : 4.0 Verandering : T.o.v.

Nadere informatie

ICT Complexiteit Binnen Organisaties Architectuur als stuurmiddel?

ICT Complexiteit Binnen Organisaties Architectuur als stuurmiddel? ICT Complexiteit Binnen Organisaties Architectuur als stuurmiddel? Colofon Auteur: Ing. Roel Konieczny rkoniecz@sci.kun.nl Opleiding: Opdracht: Universiteit: Subfaculteit: Informatiekunde ICT complexiteit

Nadere informatie

Onderzoek naar toepassing van Agent Technologie binnen Reaal Verzekeringen

Onderzoek naar toepassing van Agent Technologie binnen Reaal Verzekeringen Onderzoek naar toepassing van Agent Technologie binnen Reaal Verzekeringen Alex Bongers alex.bongers@phil.uu.nl 11 oktober 2004 Software Agents Voorwoord Deze afstudeerscriptie vormt de afsluiting van

Nadere informatie

Newyse CMS. Afstudeerscriptie. Naam: Elwin Vreeke. Werkgever: Maxxton. Begeleider Maxxton: Dhr. Jean-Pierre Mampaey

Newyse CMS. Afstudeerscriptie. Naam: Elwin Vreeke. Werkgever: Maxxton. Begeleider Maxxton: Dhr. Jean-Pierre Mampaey Newyse CMS Afstudeerscriptie Naam: Elwin Vreeke Werkgever: Maxxton Begeleider Maxxton: Dhr. Jean-Pierre Mampaey Universiteit: Technische Universiteit Delft Begeleider TU Delft: Dr. Kees van der Meer Inhoud

Nadere informatie

Algemene vaardigheden

Algemene vaardigheden Algemene vaardigheden TNW Augustus 2012 Universiteit Twente 2 Inhoudsopgave Inleiding... 5 1 Wetenschappelijke integriteit... 7 1.1 Wetenschappelijk onderzoek... 7 1.2 Vormen van inbreuken op wetenschappelijke

Nadere informatie

WHITE PAPER. Usability Testen volgens TMap NEXT. AUTEUR IDEA: usability testen

WHITE PAPER. Usability Testen volgens TMap NEXT. AUTEUR IDEA: usability testen WHITE PAPER Usability Testen volgens TMap NEXT AUTEUR IDEA: usability testen White Paper Usability Testen volgens TMap NEXT IDEA: Usability Testen december 2009 Copyright Sogeti Nederland B.V. te Vianen

Nadere informatie

Beheer- en OntwikkelModel voor Open Standaarden (BOMOS)

Beheer- en OntwikkelModel voor Open Standaarden (BOMOS) Beheer- en OntwikkelModel voor Open Standaarden (BOMOS) ICTU / Programma Nederland Open in Verbinding (NOiV) Wilhelmina van Pruisenweg 104 2595 AN Den Haag Postbus 84011 2508 AA Den Haag www.noiv.nl NOiV

Nadere informatie

LESSONS LEARNED toetsen van vraagspecificaties eisendeel. Ervaringen met toetsen uit de periode februari 2006 tot december 2008 Versie 2.

LESSONS LEARNED toetsen van vraagspecificaties eisendeel. Ervaringen met toetsen uit de periode februari 2006 tot december 2008 Versie 2. LESSONS LEARNED toetsen van vraagspecificaties eisendeel Ervaringen met toetsen uit de periode februari 2006 tot december 2008 1 A73 Tunnel Swalmen Vluchtgang (foto: Noud Brouwer, Rijkswaterstaat) Voorwoord

Nadere informatie

Het succesvol implementeren van een standaard softwaresysteem

Het succesvol implementeren van een standaard softwaresysteem Het succesvol implementeren van een standaard softwaresysteem Bachelorthesis J.N. Zwikstra - 265948 Economie & Bedrijfseconomie Erasmus Universiteit Rotterdam Begeleider: prof. dr. G.J. van der Pijl Meelezer:

Nadere informatie

Service Oriented Architecture & Logistieke Dienstverleners

Service Oriented Architecture & Logistieke Dienstverleners Service Oriented Architecture & Logistieke Dienstverleners De mogelijkheden van SOA voor logistieke dienstverleners Master thesis Informatica Variant Management & Toepassing (MT) Radboud Universiteit Nijmegen

Nadere informatie

Beheer- en Ontwikkelmodel voor Open Standaarden. Versie 2 - deel 2: de verdieping

Beheer- en Ontwikkelmodel voor Open Standaarden. Versie 2 - deel 2: de verdieping Beheer- en Ontwikkelmodel voor Open Standaarden Versie 2 - deel 2: de verdieping Inhoud Deel 1: de basis Deel 2: de verdieping 6 De ontwikkel- en beheerorganisatie 7 6.1 Organisatiestructuur 7 6.2 Beheertaken

Nadere informatie

Aan de slag met open standaarden - een handreiking voor overheidsorganisaties

Aan de slag met open standaarden - een handreiking voor overheidsorganisaties Aan de slag met open standaarden - een handreiking voor overheidsorganisaties ir. L.M. Punter, dr. ir. J.P.C. Verhoosel, ir. E.J.A. Folmer dr. ir. P.H.W.M. Oude Luttighuis Datum 18 augustus 2010 Colofon

Nadere informatie

Een automatiseringsproject,

Een automatiseringsproject, Een automatiseringsproject, een kwestie van alleen een systeem plaatsen? Organisatie Projectmanagement Procesmanagement Waarom de organisatie, projectmanagement en procesmanagement een belangrijke rol

Nadere informatie

Documentmanagement in het mbo

Documentmanagement in het mbo Documentmanagement in het mbo [Geef tekst op] Inhoud 1. INLEIDING... 3 1.1. Aanleiding... 3 1.2. Bundelen van resultaten... 3 1.3. Betrokken instellingen... 4 2. DOCUMENTMANAGEMENT: WAT IS HET?... 6 2.1.

Nadere informatie

Business Intelligence ontwikkelproces: de kritische succesfactoren voor een succesvol project

Business Intelligence ontwikkelproces: de kritische succesfactoren voor een succesvol project Business Intelligence ontwikkelproces: de kritische succesfactoren voor een succesvol project Een onderzoek naar de inrichting van kwaliteitsmanagement: de kansen van kritische succesfactoren in het software

Nadere informatie

Framework van standaarden

Framework van standaarden Framework van standaarden Geonovum datum 10 december 2007 versie 2.0 Definitief Versiebeschrijving Versienummer Jaar Versienummer Versiebeschrijving 2006-02 1.0 Eerste versie voor discussie gemaakt door

Nadere informatie

Demo of Praktijk. Een inventarisatie van het praktische toepassingsgebied van Design & Engineering Methodology for Organizations (DEMO) Mark Dumay

Demo of Praktijk. Een inventarisatie van het praktische toepassingsgebied van Design & Engineering Methodology for Organizations (DEMO) Mark Dumay Demo of Praktijk Een inventarisatie van het praktische toepassingsgebied van Design & Engineering Methodology for Organizations (DEMO) Mark Dumay Demo of Praktijk Een inventarisatie van het praktische

Nadere informatie

Master Software Engineering

Master Software Engineering Scriptie Master Software Engineering Datatransformaties door middel van Model Driven Architecture. Student: Opleiding: Docent: Stagebegeleider: Opdrachtgever: Bart Vreeken Master Software Engineering Universiteit

Nadere informatie

Quick scan laagdrempelige e-factuuroplossingen voor het mkb

Quick scan laagdrempelige e-factuuroplossingen voor het mkb Quick scan laagdrempelige e-factuuroplossingen voor het mkb In opdracht van: Ministerie van Economische Zaken Directie Regeldruk en ICT-beleid Directoraat-Generaal Bedrijfsleven en Innovatie 19 november

Nadere informatie

Trendrapport GIS. prof.dr.ir. P.J.M. van Oosterom ir. F. Penninga drs. M.E. de Vries. Onder redactie van E.M. Fendel

Trendrapport GIS. prof.dr.ir. P.J.M. van Oosterom ir. F. Penninga drs. M.E. de Vries. Onder redactie van E.M. Fendel Trendrapport GIS prof.dr.ir. P.J.M. van Oosterom ir. F. Penninga drs. M.E. de Vries Onder redactie van E.M. Fendel GISt Rapport No. 40 November 2005 RWS Report AGI-2005-GAB-01 Trendrapport GIS prof. dr.

Nadere informatie

Interne communicatie en het nieuwe werken

Interne communicatie en het nieuwe werken Afstudeeronderzoek Interne communicatie en het nieuwe werken Herm van Veen 070739 mail@hermvanveen.nl www.hermvanveen.nl Communicatie, Christelijke Hogeschool Ede Begeleid door Maarten Bakker Voorwoord

Nadere informatie