Audit Basisregistratie Topografie

Dit onderzoek is uitgevoerd in opdracht van Kadaster GEO Projectcode 5239220-01-KC

Audit Basisregistratie Topografie Resultaten van een eerste wettelijk vereiste externe controle op de kwaliteit van de BRT M.H. Storm, M. Knotters, D.J. Brus Alterra, onderdeel van Wageningen UR Wageningen, 2012

Inhoud Samenvatting 7 1 Inleiding 9 2 Resultaten 10 3 Conclusies 25 4 Aanbevelingen 27 Literatuur 28

Samenvatting Eind 2011 is door Alterra een audit uitgevoerd op de Basisregistratie Topografie. Deze audit is uitgevoerd op de in september 2011 geleverde TOP10NL data in file geodatabase formaat. De TOP10NL data zijn vergeleken met de luchtfoto s van het jaar van herziening. Het betreft dezelfde luchtfoto s als gebruikt zijn in het productieproces. In aanvulling op de luchtfoto s is gebruikt gemaakt van cyclorama s voor zover zaken niet of niet duidelijk zichtbaar waren op de luchtfoto. Bij de controle is gekeken of de data voldoen aan wat beschreven staat in de Catalogus Basisregistratie Topografie versie 2.0 en de Productspecificaties Basisregistratie Topografie versie 2.0 De gebruikte controlemethodiek is ontworpen om voor elke objectklasse een uitspraak te kunnen doen over de volgende vijf controleaspecten: logische consistentie, positionele nauwkeurigheid, actualiteit, volledigheid en thematische nauwkeurigheid. Om een objectief beeld van de kwaliteit te krijgen is een kanssteekproef uitgevoerd. De steekproef is gebaseerd op area-based sampling, nl. van gebieden van 500m x 500m. Voor deze gebieden is een full inspection uitgevoerd. Een full inspection houdt in dat alle objecten in de gelote gebieden worden gecontroleerd. Er zijn 60 gebieden geloot. Uit de audit blijkt dat de kwaliteit behoorlijk goed is. Er zijn echter een vijftal zaken die niet aan de in het Kwaliteitshandvest gestelde normen voldoen, namelijk: - De actualiteit - De logische consistentie van de objectklasse Reliëf - De thematische nauwkeurigheid van de objectklasse Spoorbaandeel - De thematische nauwkeurigheid van de objectklasse Waterdeel - De thematische nauwkeurigheid van de objectklasse Wegdeel Op basis van de bevindingen worden er aanbevelingen gedaan met betrekking tot de data, de documentatie en de gebruikte methodiek voor deze audit. 7

1 Inleiding 1.1 Achtergrond Het Kadaster is bronhouder van de Basisregistratie Topografie (BRT) en is wettelijk verplicht om eens in de drie jaar de kwaliteit hiervan te laten toetsen door een externe expert. 2011 is het eerste jaar dat deze externe controle is uitgevoerd. De resultaten, zoals beschreven in dit rapport, worden door het Kadaster gerapporteerd aan het Ministerie van Infrastructuur en Milieu. 1.2 Doel Het doel van dit onderzoek is om een uitspraak te doen over de kwaliteit van de basisregistratie en daarmee over het al dan niet voldoen aan de normen vastgelegd in het Kwaliteitshandvest van het Kadaster. De controle is uitgevoerd volgens de eerder door Alterra opgestelde methodiek (Storm et al. 2012) op basis van het Controleprotocol van het Kadaster (Van den Berg, 2011). Op dit moment is alleen TOP10NL, de dataset op schaal 1:10.000, onderdeel van de BRT. De datasets op kleinere schaal (1:50.000 en kleiner) zijn nog niet objectgericht en vormen daarmee nog geen onderdeel van de BRT. Daarom biedt dit document alleen de resultaten van de controle van de TOP10NL. 1.3 Opbouw van het rapport Dit rapport heeft een vergelijkbare opbouw als het rapport over de controlemethodiek. Dit betekent dat het volgende hoofdstuk per controleaspect de resultaten beschrijft. Deze resultaten zijn inzichtelijk gemaakt per objectklasse. Daarbij worden de meest opmerkelijke bevindingen genoemd. Dit rapport wordt afgesloten met conclusies, waarbij wordt aangegeven in hoeverre er wordt voldaan aan de norm, en aanbevelingen. 9

2 Resultaten 2.1 Inleiding Het onderzoek naar de kwaliteit van de BRT is uitgevoerd volgens de methode beschreven in het document Controlemethodiek Basisregistratie Topografie (Storm et al. 2012). Dit hoofdstuk beschrijft de keuzes resultaten. De controlemethodiek is ontworpen om voor elke objectklasse een uitspraak te kunnen doen over de volgende vijf controleaspecten: Logische consistentie: De mate van overeenstemming met regels voor de gegevensstructuur, voor de toekenning van attributen en voor relaties. Positionele nauwkeurigheid: De mate van overeenstemming tussen de gekarteerde positie en de positie op de luchtfoto s die zijn gebruikt bij de laatste herziening van het betreffende gebied. Actualiteit: Het percentage bladen dat voldoet aan de eis van 2-jaren-actualiteit. Volledigheid: De mate van aan- of afwezigheid van objecten t.o.v. de in de herziening gebruikte luchtfoto. Thematische nauwkeurigheid: De mate van juiste vulling van attributen. Het gaat om de volgende objectklassen (in alfabetische volgorde): Functioneel gebied Gebouw Geografisch gebied Inrichtingselement Registratief gebied Reliëf Spoorbaandeel Terrein Waterdeel Wegdeel De controle is uitgevoerd op de in september 2011 geleverde TOP10NL data in file geodatabase formaat. Slechts in specifieke gevallen is gekeken naar de bestanden in GML-formaat van september 2011 om daarmee uit te sluiten of specifieke fouten in de file geodatabase ook daarin voorkomen. De data zijn vergeleken met de luchtfoto s van het jaar van herziening. Het betreft dezelfde luchtfoto s als gebruikt zijn in het productieproces. In aanvulling op de luchtfoto s is gebruikt gemaakt van cyclorama s voor zover zaken niet of niet duidelijk zichtbaar waren op de luchtfoto. Bij de controle is gekeken of de data voldoen aan wat beschreven staat in de Catalogus Basisregistratie Topografie versie 2.0 (catalogusbrt2_0.pdf) en de Productspecificaties Basisregistratie Topografie versie 2.0 (productspecificaties_brt_2.0.pdf. De volgende paragrafen beschrijven de resultaten per controleaspect. 10

2.2 Actualiteit van de dataset Het controleprotocol van het Kadaster (Van den Berg, 2011) geeft de volgende definitie van actualiteit: De actualiteit betreft het aantal kaartbladen dat geactualiseerd in de kerndatabase is geplaatst. Uitgegaan wordt van het jaar waarin de luchtfoto is gemaakt en die derhalve als basis heeft gediend voor de actualisatie. Gerapporteerd wordt het percentage bladen dat voldoet aan de eis van 2-jaren-actualiteit. De actualiteit van de geleverde bestanden komt overeen met de actualiteit van de kerndatabase. Met kaartblad wordt een in noord- en zuidversie opgedeeld 1:25.000-kaartblad bedoeld. Bij een herziening worden alle objectklassen meegenomen. Dit betekent dat de actualiteit voor alle objectklassen hetzelfde zal zijn. Het Kadaster heeft zelf een overzicht waarop per gebied(1:50.000-kaartblad) is te zien van welk jaar de gebruikte luchtfoto is. Dit overzicht wordt gebruikt om het percentage bladen te rapporteren dat voldoet aan de actualiteitseis van twee jaar. BRT ACTUALITEITSKAART: TOP10NL 2006 2008 1 W 1 O 2 W 2 O 3 W 3 O 2009 2010 4 O 5 W 5 O 6 W 6 O 7 W 7 O 8 W Jaartallen geven de actualiteit van de luchtfoto's weer waarop de TOP10NL data gebaseerd is. 9 W 10 W 10 O 11 W 11 O 12 W 12 O 13 W Status op 01 september 2011 14 W 14 O 15 16 W 16 O 17 W 17 O 18 W 19 W 19 O 20 21 W 21 O 22 W 22 O 25 W 25 O 26 W 26 O 27 W 27 O 28 W 28 O 30 O 31 W 31 O 32 W 32 O 33 W 33 O 34 W 34 O 37 W 37 O 38 W 38 O 39 W 39 O 40 W 40 O 41 W 41 O 64 O 43 W 43 O 44 W 44 O 45 W 45 O 46 W 65 W 65 O 49 W 49 O 50 W 50 O 51 W 51 O 52 W 52 O 67 W 67 O 55 W 57 W 57 O 58 W 58 O 68 W 68 O 69 W 69 O Figuur 1: De door het Kadaster geleverde actualiteitskaart van TOP10NL. Zoals in figuur 1 te zien is, kan er binnen een kaartblad verschil in actualiteit zitten. In deze gevallen bepaalt de oudste luchtfoto de actualiteit van het hele kaartblad. Met behulp van ArcGIS software en de actualiteitskalender van het Kadaster als shapefile is bepaald wat de oudste luchtfoto is die gebruikt is bij de herziening van het kaartblad. Tabel 1 geeft het aantal kaartbladen met het jaartal van de oudste gebruikte luchtfoto. 11

Tabel 1 Jaartallen van de oudste luchtfoto s die voor kaartbladen van TOP10NL zijn gebruikt Jaartal Aantal kaartbladen 2006 31 2007 0 2008 128 2009 275 2010 359 Totaal 793 Het totale aantal kaartbladen is 793 (A). Het aantal kaartbladen waarvan de actualiteit maximaal 2 jaar ligt voor de datum van levering is 359 + 275 = 634 (B) Daarmee komt het percentage bladen dat voldoet aan 2 jaren actualiteit op 634/793*100 = 79,95%.Dit is geen 100%, dus niet alle TOP10NL data voldoen aan de norm die gesteld is voor de actualiteit. 12

2.3 Kwaliteitsgegevens per objectklasse De actualiteit van TOP10NL wordt gegeven voor de hele dataset. De andere vier controleaspecten, die worden gebruikt om de kwaliteit van de data te toetsen, worden per objectklasse vastgelegd. Het gaat daarbij om de volgende onderwerpen: Logische consistentie Positionele nauwkeurigheid Volledigheid Thematische nauwkeurigheid Het is praktisch gezien niet mogelijk om deze thema s voor alle objecten in de dataset te controleren. Om een objectief beeld van de kwaliteit te krijgen is een kanssteekproef uitgevoerd. Storm et al. (2012) beschrijven de details van de opzet van deze steekproef. Hier vatten we deze opzet kort samen. De steekproef is gebaseerd op area-based sampling, nl. van gebieden van 500m x 500m (1/4km-hokken). Voor deze gebieden is een full inspection uitgevoerd. Een full inspection houdt in dat alle objecten in de gelote 1/4km-hokken worden gecontroleerd. Binnen de gelote 1/4km-hokken worden alle objecten in hun geheel beoordeeld, dus ook het deel dat buiten het km-hok valt. Van de lijnobjecten en vlakobjecten wordt bepaald welke fractie binnen de begrenzing van het 1/4km-hok ligt. Indien bijvoorbeeld een lijn voor 20% in het geselecteerde km-hok ligt, dan wordt dit lijnobject geteld als 0,2 goed of 0,2 fout in de telling van het aantal goede of foute objecten per 1/4km-hok. Vervolgens kan men het totaal aantal fouten per 1/4km-hok tellen en met behulp van de ratio-schatter (zoals beschreven in Storm et al. (2012) en Brus et al. (2006)) het percentage objecten met een fout per objectklasse voor heel Nederland schatten. Tijdens de controle zijn de afzonderlijke features voor een zelfde object in de file geodatabase als apart object beschouwd, terwijl de verschillende features in feite samen een enkel object vormen. Bijvoorbeeld: De features uit de feature classes WEGDEEL_VLAK, WEGDEEL_LIJN, WEGDEEL_PUNT, WEGDEEL_HARTLIJN en WEGDEEL_HARTPUNT zijn alle als afzonderlijke objecten beschouwd. Voor een juiste bepaling van de steekproefomvang dient er informatie beschikbaar te zijn over de variatie in fouten. Bij deze eerste controle was deze informatie niet beschikbaar en is de steekproefomvang bepaald door de beschikbare tijd om de controle uit te voeren. Op basis daarvan is de steekproefomvang vastgesteld op 60 gebieden van 500x500 meter. De steekproefgebieden zijn geloot, waarbij de twaalf provincies zijn gebruikt als strata om een betere spreiding over Nederland te verkrijgen. In figuur 2 zijn de locaties van de geselecteerde 1/4km-hokken weergegeven. De aantallen objecten binnen deze gebieden worden getoond in tabel 2. 13

Figuur 2: De locaties van de gelote ¼km-hokken waarop een full inspection is uitgevoerd. Tabel 2: De aantallen objecten per objectklasse binnen de gelote ¼km-hokken Functioneel gebied 9 Gebouw 3009 Geografisch gebied 19 Inrichtingselement 1070 Registratief gebied 81 Relief 674 Spoorbaandeel 8 Terrein 2188 Waterdeel 2069 Wegdeel 6230 Opvallend zijn de lage aantallen bij functioneel gebied en spoorbaandeel. Van deze objectklassen bestaan relatief weinig objecten in TOP10NL en daardoor ook in de steekproef. De spoorbaandelen in de steekproef komen bijvoorbeeld alleen voor in de provincies Groningen, Limburg en Overijssel. De geschatte aantallen fout gekarteerde objecten als fractie van het totaal aantal objecten, zoals die verderop in dit rapport staan vermeld, gelden daarom eigenlijk alleen voor deze provincies. Een nauwkeurige schatting van het aantal fout gekarteerde objecten als fractie van het totaal aantal objecten is voor de objectklasse Spoorbaandeel is niet goed mogelijk voor heel Nederland. Het is aan te bevelen om te zorgen dat bij toekomstige controles de steekproef zodanig wordt opgezet dat er in elke provincie een object uit elke objectklasse voorkomt of om toch te kiezen voor feature based sampling i.p.v. de hier gehanteerde area based sampling. De volgende paragrafen geven de resultaten per kwaliteitsaspect. 14

2.3.1 Logische consistentie De validatie van logische consistentie vindt plaats door middel van interne directe evaluatie, wat wil zeggen dat alleen de data van TOP10NL worden gebruikt om logische consistentie te beoordelen. Logische consistentie wordt gekwantificeerd met het geschatte percentage objecten met een fout hierin. Het Kadaster controleert tijdens het productieproces automatisch op een groot aantal aspecten van logische consistentie. Een aandachtspunt is dat er onbekende fouten kunnen voorkomen, waarin de controleprogrammatuur van het Kadaster momenteel niet voorziet. Er is dus gekeken of er fouten voorkomen doordat hierop tijdens de productie niet (automatisch) is gecontroleerd. Er zijn fouten in de logische consistentie ontdekt doordat de huidige controleprogrammatuur van het Kadaster niet op de volgende zaken controleert: Vlakken van wegdelen, waterdelen en terrein moeten samen landsdekkend (dus zonder gaten zijn). Dit blijkt niet het geval. In figuur 3 is voor de provincie Utrecht te zien waar er gaten zitten, dus waar geen wegdeelvlak, waterdeelvlak of terreinvlak aanwezig is. Figuur 3: Locaties waar geen terrein, wegdeel en/of waterdeel voorkomt. In een aantal objectklassen zijn ten onrechte gesplitste objecten ontdekt. Hierbij liggen de objecten tegen elkaar, hebben ze dezelfde attribuutwaarden en is er geen ander object dat het betreffende objecten kan snijden. Eigenlijk zouden de afzonderlijke objecten dan samen één object moeten vormen. Er is nog geen regel die hierop controleert. Verder wordt er in de documentatie maar beperkt ingegaan op de objectvorming en welke objecten andere objecten snijden. Daardoor is het lastig te beoordelen of dit op een juiste wijze is gebeurd. Het is aan te bevelen om in de validatiesoftware een controle op te nemen die op bovenstaande zaken controleert en om in de productspecificaties meer informatie op te nemen over objectvorming. Omdat de validatieprogrammatuur alleen wordt gebruikt bij een herziening van een gebied zal niet voor heel Nederland de laatste versie van de validatieprogrammatuur gebruikt zijn. Tijdens de controle zijn 15

validatieregels toegepast zoals beschreven in de laatste versie van de softwarebeschrijving. Daaruit kwamen wel fouten naar voren, maar deze waren alle te wijten aan overbodige objecten ( commissies ). Deze zijn als commissiefout beoordeeld en daarom niet nogmaals als fout in de logische consistentie. In het controleproces is per object bijgehouden of er een fout in de logische consistentie is gevonden. In tabel 3 is per objectklasse het aantal objecten weergegeven met en zonder fouten in de logische consistentie. Op basis daarvan is met behulp van de ratioschatter (Storm et al. 2012, Brus et al. 2006) het percentage objecten voor heel Nederland berekend met een of meerdere fouten in de logische consistentie. Hiervan wordt ook de standaardfout weergegeven. De standaardfout is een maat voor de nauwkeurigheid van de schatting. Als de steekproef een groot aantal keren zou worden gehaald, dan variëren de uitkomsten. De standaardfout geeft deze variatie aan: het is de standaardafwijking van de uitkomsten van de herhaalde steekproeven. De standaardafwijking is de wortel uit de som van de gekwadrateerde afwijkingen t.o.v. het gemiddelde. Objecten die als commissiefout zijn beoordeeld, dus op de luchtfoto of de cyclorama niet voorkwamen, zijn buiten beschouwing gelaten bij de controle op logische consistentie. Tabel 3: Resultaten m.b.t. de logische consistentie Objectklasse Aantal goede objecten in de geselecteerde 60 1/4kmhokken Aantal foute objecten in de geselecteerde 60 1/4kmhokken Geschatte percentage objecten met fout in de logische consistentie voor heel Nederland Standaardfout van het geschatte percentage objecten met fout in de logische consistentie Functioneel gebied 9 0 0,00% 0,00 Gebouw 3007 0 0,00% 0,00 Geografisch gebied 19 0 0,00% 0,00 Inrichtingselement 1050 6 0,68% 0,05 Registratief gebied 87 0 0,00% 0,00 Reliëf 527 128 23,50% 2,35 Spoorbaandeel 8 0 0,00% 0,00 Terrein 2187 0 0,00% 0,00 Waterdeel 2052 2 0,04% 0,00 Wegdeel 6150 25 0,35% 0,00 Opvallend is het percentage objecten met een fout in de logische consistentie in de objectklasse Reliëf. Er komen veel hoogteverschillen voor die bestaan uit meerdere afzonderlijke reliëfobjecten, terwijl ze goed als een enkel reliëfobject hadden kunnen voorkomen. Deze fout in de logische consistentie is waarschijnlijk een gevolg van de wijze waarop de gegevens vanuit TOP10vector zijn geconverteerd. In figuur 4 is een voorbeeld opgenomen van heuvel in het landschap welke d.m.v. taluds met een hoge zijde en een lage zijde zijn opgenomen in TOP10NL. In de figuur heeft elk object een andere kleur. Sommige heuvels staan in TOP10NL als vier verschillende objecten. 16

Figuur 4: Ten onrechte in meerdere reliëf-objecten opgesplitste heuvels met op de achtergrond een luchtfoto. Elke kleur is een ander object, De parallele lijnen geven de hoge en de lage zijde van het talud/hoogteverschil aan. 2.3.2 Positionele nauwkeurigheid Positionele nauwkeurigheid geeft de mate van overeenstemming aan tussen de gekarteerde en werkelijke positie van elementen. Bij de validatie van TOP10NL gaat het om de overeenstemming met de positie op de luchtfoto s die zijn gebruikt bij de laatste herziening van het betreffende gebied. Er zijn twee normen voor de positionele nauwkeurigheid van objecten in TOP10NL. Ten eerste geldt dat de root mean square error (RMSE) voor een object maximaal 3 meter mag zijn. Ten tweede geldt een maximale afwijking van 5 meter ten opzichte van de luchtfoto. Het is zeer arbeidsintensief om voor objecten de RMSE te berekenen, omdat hierbij het object opnieuw gedigitaliseerd moet worden. Het was niet mogelijk om binnen de beschikbare tijd voor een representatief aantal objecten op deze norm te controleren. De hier getoonde resultaten hebben dus alleen betrekking op de maximale afwijking van 5 meter. Niet voor alle objectklassen is de positionele nauwkeurigheid goed te bepalen. De oorzaak hiervan is dat de (begrenzing van) bepaalde objecten niet altijd zichtbaar is in het terrein en / of op luchtfoto s of cyclorama s. Het gaat dan vooral om objecten van de objectklassen functioneel gebied, geografisch gebied, registratief gebied en reliëf. 17

De positie van objecten is visueel gecontroleerd. Er zijn buffers van 5 meter gegenereerd om de puntobjecten, de lijnobjecten en de omtrek van de vlakobjecten uit TOP10NL. Indien het object (of in geval van vlakobjecten de omtrek van het object) op de luchtfoto geheel of gedeeltelijk buiten de buffer ligt, dan voldoet het niet aan de norm en wordt het als fout aangemerkt. Wegdelen kennen meerdere geometrieën per object, namelijk een werkelijke geometrie en een hartlijngeometrie. Voor hartlijnen en hartpunten van wegdelen is op een andere wijze bepaald of deze positioneel goed geplaatst zijn. Deze lijnen en punten moeten op of binnen de lijn- of vlakgeometrie liggen. Indien dit niet het geval was, dan is de geometrie hiervan als fout beschouwd. Objecten die als commissiefout zijn beoordeeld, dus op de luchtfoto of de cyclorama niet voorkwamen, zijn buiten beschouwing gelaten bij de controle op positionele nauwkeurigheid. In tabel 4 staan de aantallen objecten die goed zijn (dus voldoen aan de norm) en die fout zijn goed (dus een afwijking hebben van meer dan 5 meter) en het met de ratioschatter geschatte percentage objecten met een te grote afwijking voor heel Nederland. Tabel 4: Resultaten m.b.t. de positionele nauwkeurigheid Objectklasse Aantal goede objecten in de geselecteerde 60 1/4kmhokken Aantal foute objecten in de geselecteerde 60 1/4kmhokken Geschatte percentage objecten met fout in de positionele nauwkeurigheid voor heel Nederland Standaardfout van het geschatte percentage objecten met fout in de positionele nauwkeurigheid Functioneel gebied 9 0 0,00% 0,00 Gebouw 3004 3 0,13% 0,01 Geografisch gebied 19 0 0,00% 0,00 Inrichtingselement 1051 5 1,06% 0,05 Registratief gebied 78 0 0,00% 0,00 Reliëf 646 9 1,02% 0,10 Spoorbaandeel 8 0 0,00% 64,56 Terrein 2183 4 0,14% 0,01 Waterdeel 2030 24 0,51% 0,01 Wegdeel 6019 131 2,51% 0,02 Opmerking: Spoorbaandeel heeft betrekking op de provincies Groningen, Limburg en Overijssel, omdat in de andere provincies geen spoorbaandelen voorkwamen in de geselecteerde ¼-km-hokken. De standaardfout is gebaseerd op geschatte totale aantallen objecten in deze provincies. 18

Figuur 5: Voorbeeld van een lijnvormig wegdeel met een te grote positionele afwijking. Op de luchtfoto ligt het wegdeel buiten de gearceerde buffer van 5 meter om het lijnobject. 2.3.3 Volledigheid Onder volledigheid (completeness) verstaan we de aan- of afwezigheid van objecten, hun attributen of hun relaties (Jakobsson en Giversen, z.j.). We maken onderscheid tussen omissie (het ontbreken van gegevens) en commissie (teveel aan gegevens). Volledigheid, positionele nauwkeurigheid en thematische nauwkeurigheid hangen met elkaar samen. Onvolledigheid kan leiden tot lagere thematische nauwkeurigheid. Als bijvoorbeeld één terreinobject in TOP10NL op de luchtfoto uit twee terreinobjecten bestaat, kan dat worden gezien als een omissie en als een classificatiefout. Een positionele afwijking van een puntobject over de grens van een geselecteerd 1/4km-hok heen kan zich uiten als een omissiefout en/of commissiefout. Het aantal omissies en commissies kan door een volledige inspectie voor elk van de geselecteerde 1/4kmhokken worden vastgesteld. Per objectklasse wordt in elk geselecteerd 1/4km-hok het aantal ontbrekende en het aantal overvloedige objecten geteld (resp. omissies en commissies). Vervolgens wordt het aantal omissies en commissies per oppervlakte-eenheid (vierkante km) voor heel Nederland geschat. De cijfers die dit per objectklasse oplevert zijn onderling niet goed vergelijkbaar omdat de objecten uit de verschillende objectklassen niet in gelijke hoeveelheden voorkomen. Om te controleren of er voldaan wordt aan de norm voor volledigheid (95%), wordt ook een geschat percentage ommissies en commissies gegeven. Dit cijfer is echter afhankelijk van het aantal objecten in TOP10NL. Het aantal objecten in TOP10NL is weer afhankelijk van het aantal ommissies en commissies. Daardoor is het percentage omissies en commissies afhankelijk van zichzelf en niet helemaal een zuivere graadmeter. De percentages voor de verschillende objectklassen zijn echter wel met elkaar te vergelijken i.t.t. de aantallen omissies en commissies per vierkante kilometer. In tabel 5 staan het aantal gevonden ommissies in de gelote 1/4km-hokken, het geschatte percentage ommissies voor heel Nederland (t.o.v. het aantal objecten in TOP10NL) met de standaardfout daarvan en het geschatte aantal omissies per vierkante kilometer voor heel Nederland. In tabel 6 staan dezelfde cijfers, maar dan voor commissies. 19

Tabel 5: De resultaten m.b.t. omissies Objectklasse Aantal gevonden omissies in de geselecteerde 60 1/4km-hokken Functioneel gebied Geschatte percentage omissies voor heel Nederland Standaardfout van het geschatte percentage omissies Geschatte aantal omissies per km 2 voor heel Nederland 0 0,00% 0,00 0,00 Gebouw 15 0,67% 0,02 2,36 Geografisch gebied 0 0,00% 0,00 0,00 Inrichtingselement 23 2,75% 0,00 4,72 Registratief gebied 1 0,00% 0,00 0,00 Reliëf 4 0,46% 0,00 0,39 Spoorbaandeel 0 0,00% 0,00 0,00 Terrein 0 0,00% 0,00 0,00 Waterdeel 14 0,46% 0,01 1,43 Wegdeel 91 2,80% 0,03 18,21 Tabel 6: De resultaten m.b.t. de commissies Objectklasse Aantal gevonden commissies in de geselecteerde 60 1/4km-hokken Functioneel gebied Geschatte percentage commissies voor heel Nederland Standaardfout van het geschatte percentage commissies Geschatte aantal commissies per km 2 voor heel Nederland 0 0,00% 0,00 0,00 Gebouw 2 0,04% 0,00 0,14 Geografisch gebied 0 0,00% 0,00 0,00 Inrichtingselement 14 1,40% 0,05 2,12 Registratief gebied 3 3,91% 1,75 0,00 Reliëf 19 2,51% 0,13 2,05 Spoorbaandeel 0 0,00% 0,00 0,00 Terrein 1 0,09% 0,01 0,18 Waterdeel 15 0,71% 0,02 2,19 Wegdeel 80 1,13% 0,01 6,99 In de objectklasse Registratief gebied is Nederland als land als omissie geconstateerd. De meeste omissies van wegdelen bestaan uit ontbrekende wegpunten op plaatsen waar lijnvormige wegdelen bij elkaar komen. Wegpunten komen in hun geheel niet voor in de filebased geodatabase met TOP10NL van heel Nederland. In de GML-bestanden komen overigens wel wegpunten voor, dus de oorzaak van deze omissies lijkt te liggen in de omzetting van GML naar file geodatabase. Sommige wegdelen die als lijn waren opgenomen, zouden als vlak moeten zijn opgenomen. Dit is geregistreerd als commissies en omissies. Opvallend bij wegdelen is dat relatief veel commissies zijn ontstaan doordat parallel gelegen fietspaden in bebouwd gebied zijn opgenomen die er in werkelijkheid wel zijn, maar die volgens de inwinningscriteria niet ingewonnen worden. Zie figuur 6. 20

Figuur 6: Parallele fietspaden in bebouwd gebied die volgens de inwinningscriteria niet in de dataset zouden mogen voorkomen. Soms worden er bij reliëf lijnen van lage zijdes gevonden zonder bijbehorende hoge zijde. Het lijkt dan te gaan om verwijderde objecten, waarvan niet de lage zijde is verwijderd. 2.3.4 Thematische nauwkeurigheid Bij thematische nauwkeurigheid gaat het om de mate van juiste vulling van attributen. Omdat het arbeidsintensief werk is om alle attributen te controleren, worden bij een externe controle niet alle attributen gecontroleerd. Een aantal attributen moeten vanwege het belang ervan bij elke externe controle worden gecontroleerd Een andere set attributen wordt eens per drie externe controles gecontroleerd, waarbij de te controleren attributen volgens een roterend steekproefpatroon bepaald worden. Deze zijn in onderstaand overzicht met een asterisk (*) gemarkeerd. Er zijn ook attributen die niet m.b.v. luchtfoto s en/of cyclorama s gecontroleerd kunnen worden. Hieronder worden in alfabetische volgorde per objectklasse de attributen genoemd die in deze controle zijn meegenomen: Functioneel gebied: - Naam (Nl)* - Type functioneel gebied Gebouw: - Hoogteniveau* 21

- Naam (Fr)* - Type gebouw Geografische Gebied: - Naam (Fr)* - Type geografisch gebied Inrichtingselement: - Hoogteniveau* - Naam (Nl)* - Type inrichtingselement Registratief gebied - Type registratief gebied Relief: - Naam (Fr)* - Naam (Nl)* - Type relief Spoorbaandeel: - Aantal sporen* - Elektrificatie* - Hoogteniveau* - Type infrastructuur - Type spoorbaan Terrein: - Fysiek voorkomen* - Naam (Fr)* - Type landgebruik Waterdeel: - Functie* - Fysiek voorkomen* - Naam (Fr)* - Stroomrichting* - Type infrastructuur - Type water Wegdeel: - Fysiek voorkomen* - Hoofdverkeersgebruik - Status* - S-wegnummer* - Straatnaam (Fr)* - Tunnelnaam* - Type infrastructuur - Type weg - Verhardingsbreedteklasse* 22

Bij de controle is rekening gehouden met het onderscheid tussen verplichte en optionele attributen. Bij optionele attributen is het toegestaan dat het attribuut geen waarde heeft. Ook is gelet op de multipliciteit van attributen. De multipliciteit geeft aan hoeveel waarden een attribuut mag hebben. Objecten die als commissiefout zijn beoordeeld, dus op de luchtfoto of de cyclorama niet voorkwamen, zijn buiten beschouwing gelaten bij de controle op thematische nauwkeurigheid. In tabel 7 staan per objectklasse het aantal goede objecten (zonder fout in de gecontroleerde attributen), het aantal foute objecten (met een of meerdere fouten in de gecontroleerde attributen) en het geschatte percentage objecten in Nederland met een fout in de gecontroleerde attributen en de standaardfout daarvan. Tabel 7: De resultaten m.b.t. de thematische nauwkeurigheid Objectklasse Aantal goede objecten in de geselecteerde 60 1/4kmhokken Aantal foute objecten in de geselecteerde 60 1/4kmhokken Geschatte percentage objecten met fout in de attributen voor heel Nederland Standaardfout van het geschatte percentage objecten met fout in de attributen Functioneel gebied 9 0 0,00% 0,00 Gebouw 3007 0 0,04% 0,00 Geografisch gebied 19 0 0,00% 0,00 Inrichtingselement 1053 3 0,94% 0,04 Registratief gebied 78 0 0,00% 0,00 Reliëf 655 0 0,00% 0,00 Spoorbaandeel 7 1 20,98% 23,85 Terrein 2181 6 0,29% 0,01 Waterdeel 0 2054 99,29% 0,02 Wegdeel 5346 804 13,71% 0,10 Spoorbaandeel lijkt een hoog percentage foute objecten te hebben, maar dit kan een gevolg zijn van het beperkt aantal gelote 1/4km-hokken waarbinnen objecten voorkomen die tot de objectklasse Spoorbaandeel behoren. Aan de standaardfout is te zien dat deze waarde bij herhaalde steekproeven erg kan variëren. Om tot statistisch zuivere waarden te komen, is de standaardfout voor spoorbaandeel gebaseerd op de geschatte aantallen objecten in de provincies waar de spoorbaandelen uit de steekproef voorkwamen (Groningen, Limburg en Overijssel). In objectcatalogus staat dat bij wegdelen met hoofdverkeersgebruik=fietsers, bromfietsers er een bord moet staan die dit aangeeft. Dit is niet altijd het geval. Aan andere kenmerken, bijvoorbeeld de kleur van het wegdek is wel te zien dat het wegdeel bestemd is voor fietsers. Strikt genomen zouden dit soort fietspaden dan niet fietsers, bromfietsers als hoofdverkeersgebruik mogen hebben, maar bijvoorbeeld overig. Dit is echter niet fout gerekend. Het is aan te bevelen om nog eens goed de inwinningscriteria onder het licht te houden. Belangrijke doorgaande wegdelen hebben vaak hoofdverkeersgebruik = gemengd als kenmerk terwijl er een fietspad naast ligt en het soms met borden expliciet verboden is voor langzaam verkeer. In dat geval moet het kenmerk hoofdverkeersgebruik = snelverkeer zijn. Deze fout komt vrij vaak voor. Wat ook vaak is geconstateerd is dat hartlijnen tussen twee kruisingsvlakken vaak onterecht hoofdverkeersgebruik=overig en typeweg=overig als kenmerk hebben. Opvallend is het aantal fouten bij waterdelen. Elk waterdeel heeft als kenmerk type infrastructuur = overig watergebied, maar volgens definitie is iets eigenlijk altijd een verbinding of kruising. Het attribuut type 23

infrastructuur is daardoor altijd als fout gerekend. Het probleem zit hem eigenlijk niet zo zeer in de data, maar in de definitie die gehanteerd wordt in de documentatie. Het is dus aan te bevelen om de definities aan te passen. Het attribuut functie van waterdelen is soms als onbekend aangegeven, terwijl duidelijk is dat hier overig ingevuld had moeten worden. Dit lijkt sinds de herziening in 2010 al aangepast te zijn. 24

3 Conclusies Na een uitvoerige controle blijkt de kwaliteit van TOP10NL behoorlijk goed. Er zijn een vijftal zaken die niet aan de in het Kwaliteitshandvest gestelde normen voldoen, namelijk: - De actualiteit - De logische consistentie van de objectklasse Reliëf - De thematische nauwkeurigheid van de objectklasse Spoorbaandeel - De thematische nauwkeurigheid van de objectklasse Waterdeel - De thematische nauwkeurigheid van de objectklasse Wegdeel Het percentage bladen dat voldoet aan 2 jaren actualiteit is 79,95%. Dit is geen 100%, dus niet alle TOP10NL data voldoet aan de norm. Omdat alle objectklassen tegelijk worden meegenomen in een herziening, geldt het genoemde percentage voor alle objectklassen. In tabel 8 zijn de overige kwaliteitsaspecten samengevat voor de verschillende objectklassen. In rood zijn de cijfers weergegeven die niet voldoen aan de norm van 95% juist uit het Kwaliteitshandvest. Tabel 8: Overzicht van de resultaten. Logische consistentie Positionele nauwkeurigheid Volledigheid Thematische nauwkeurigheid Objectklasse Geschatte percentage objecten met fout in de logische Geschatte percentage objecten met fout in de positionele Geschatte percentage omissies voor heel Nederland Geschatte aantal omissies per km 2 Geschatte percentage commissies voor heel Nederland Geschatte aantal commissies per km 2 Geschatte percentage objecten met fout in de attributen consistentie nauwkeurigheid Functioneel gebied 0,00% 0,00% 0,00% 0,00 0,00% 0,00 0,00% Gebouw 0,00% 0,13% 0,67% 2,36 0,04% 0,14 0,04% Geografisch gebied Registratief gebied 0,00% 0,00% 0,00% 0,00 0,00% 0,00 0,00% 0,68% 1,06% 2,75% 4,72 1,40% 2,12 0,94% 0,00% 0,00% 0,00% 0,00 3,91% 0,00 0,00% Reliëf 23,50% 1,02% 0,46% 0,39 2,51% 2,05 0,00% Inrichtingselement Spoorbaandeel 0,00% 0,00% 0,00% 0,00 0,00% 0,00 20,98% Terrein 0,00% 0,14% 0,00% 0,00 0,09% 0,18 0,29% Waterdeel 0,04% 0,51% 0,46% 1,43 0,71% 2,19 99,29% Wegdeel 0,35% 2,51% 2,80% 18,21 1,13% 6,99 13,71% 25

Opvallend is het hoge percentage waterdeel-objecten met een fout in de attributen. De oorzaak hiervan is dat het attribuut type infrastructuur altijd als fout is gerekend. Het probleem zit hem eigenlijk niet in de data, maar in de definitie die gehanteerd wordt in de documentatie. Het is aan te bevelen om de gebruikte definities nog eens goed onder het licht te houden. Een tweede aandachtspunt is de opdeling van reliëfobjecten. Vaak bestaat een hoogteverschil uit meerdere reliefobjecten, terwijl dit als een enkel reliëfobject had kunnen worden opgenomen. Het cijfer voor de thematische nauwkeurigheid van de objectklasse spoorbaandeel kent een hoge standaardfout, wat betekent dat dit cijfer bij een herhaalde steekproef een heel andere waarde kan hebben. De oorzaak hiervan is het lage aantal spoorbaandelen in de steekproef. De thematische nauwkeurigheid voor wegdelen voldoet ook niet aan de norm. Veel voorkomende fouten die hier betrekking op hebben zijn genoemd in paragraaf 2.3.4. 26

4 Aanbevelingen Naar aanleiding van het onderzoek naar de kwaliteit van TOP10NL kunnen er aanbevelingen gedaan worden met betrekking tot de documentatie, de data en de methodiek die gebruikt is in de audit. 4.1 Aanbevelingen m.b.t. de documentatie Met betrekking tot de documentatie is het volgende aan te bevelen: Kijk kritisch naar definities (van bijvoorbeeld de waarden van het attribuut type infrastructuur van waterdelen) en inwinningscriteria (van bijvoorbeeld parallelle fietspaden) zoals deze genoemd staan in de objectcatalogus. Neem meer informatie op over opdeling van objecten in de productspecificaties Het genoemde percentage voor volledigheid en juistheid (95%) is juist voor volledigheid niet een zuivere indicatie. Volledigheid betreft de aan- en afwezigheid van objecten t.o.v. het totaal aantal objecten. Dit totaal is weer afhankelijk van de aan- en afwezigheid van objecten. Mogelijk is het beter om een indicatie te geven van het aantal toegestane omissies en commissies per objectklasse. 4.2 Aanbevelingen m.b.t. de data Met betrekking tot de data is het volgende aan te bevelen: Voorkom onnodige opdeling van objecten (bijvoorbeeld bij reliëf). Voorkom gaten en dubbele objecten in de data. Beide zaken kunnen worden opgelost door extra controles op te nemen in de validatiesoftware. 4.3 Aanbevelingen m.b.t. de gebruikte methodiek Met betrekking tot de gebruikte methodiek is het volgende aan te bevelen: Pas steekproef aan zodat er van elke objectklasse voldoende objecten zijn om tot betrouwbare resultaten te komen. De gebruikte area based steekproef zou bijvoorbeeld per objectklasse uitgevoerd kunnen worden. 27

Literatuur Berg, J.P. van den, 2011. Controleprotocol TOP10NL, versie 1.0. Apeldoorn, Kadaster. Brus, D.J., W. Nieuwenhuizen en A. Koomen, 2006. Can we gain precision by sampling with probabilities proportional to size in surveying recent landscape changes in the Netherlands? Environmental Monitoring and Assessment 122: 153-169. Jakobsson, A. en J. Giversen, z.j., Guidelines for implementing the ISO 19100 geographic information quality standards in national mapping and cadastral agencies. Eurogeographics. Storm, M.H., M. Knotters en D. Brus, 2012. Controlemethodiek Basisregistratie Topografie. Wageningen, Alterra. 28