OP EN IN HET WEB Hoe de toegankelijkheid van juridische informatie kan worden verbeterd Marc van Opijnen Kennis- en Exploitatiecentrum Officiële Overheidspublicaties 14 mei 2014 KNVI-JI, Den Haag marc.opijnen@koop.overheid.nl
CV 1990 Doctoraal Nederlands/internationaal recht RuG 1995-2000 Raad voor Rechtsbijstand Arnhem 2000-2010 Bureau Internetsystemen en Toepassingen Rechterlijke Organisatie (Bistro) 2011-2013 Spir-it 2013- Kennis- en Exploitatiecentrum Officiële Overheidspublicaties (KOOP) 2007-2014 Doctoraat UvA 2004- EU-Raadswerkgroep e-law/e-justice.
3
Onderwerpen Publicatie van rechterlijke uitspraken: juridisch kader en stand van zaken Open, linked & big data Identificatie: ECLI & ELI Links: jurisprudentie, regelgeving & literatuur Rekenen met het recht.
Juridisch kader Openbaarheid van de uitspraak Verstrekking Toegankelijkheid Anonimisering.
De stand van zaken in Nederland De geschiedenis van Rechtspraak.nl Porta Iuris Het beleid van de rechtspraak In jaardocumenten In vergelijking met tijdschriften In vergelijking met zaaksafhandelingsgegevens Voldoet Nederland aan juridisch kader? Ja, maar: Uitspraken van het EHRM Onherroepelijkheid van uitspraken is niet in beeld Toegankelijkheid, in het bijzonder hanteerbaarheid kan beter.
Artikel 5 EU-Hergebruikrichtlijn
Open & linked data Beschikbaar op het web onder open licentie Gestructureerde, machineleesbare data Non-proprietary formaten Voorzien van URIs om data te identificeren Gelinkt aan andere data. Standaarden nodig
U S A G E User interfaces Special collections Statistics and other advanced stuff Linked open data P R O D U C T I O N Adding links > 5 star Adding URIs > 4 star Conversion > 3 star 5 star data 1/2 star data
Identificatie: ECLI Eenduidige, unieke en persistente identificatie van rechterlijke uitspraken is noodzakelijk Vindplaats Triplet: instantienaam, zaaknummer, datum Landelijk JurisprudentieNummer (LJN) European Case Law Identifier (ECLI): ECLI:[land]:[gerecht]:[jaar]:[nummer] Nationale implementatie Europees portaal.
European Case Law Identifier 12
13
14
15
Introductie ECLI Hof van Justitie EU Europees Hof voor de Rechten van de Mens Europees Patent Bureau Europese Commissie & lidstaten: ECLI search interface. Gereed 2014-Q3.
7-3-2014 Data: open, linked & big 23
European Legislation Identifier 24
U S A G E User interfaces Special collections Statistics and other advanced stuff Linked open data P R O D U C T I O N Adding links > 5 star Adding URIs > 4 star Conversion > 3 star 5 star data 1/2 star data
Linked data: contextualiteit Juridische teksten bestaan uit woorden en verwijzingen Die verwijzingen vormen een (semantisch) web van gerelateerde informatiecomponenten (linked data) Maar op basis van die relaties is niet te zoeken Geef mij alle uitspraken over artikel 5 van Verordening (EEG) nr. 1408/71 Geef mij alle jurisprudentie en literatuur waarin deze uitspraak van de Hoge Raad wordt aangehaald.
Linked Data Overheid Jurisprudentie Adviezen Maken van links Commentaren Decentrale regelgeving Wetten Zoek / gebruik links Kamerstukken Beleidsregels Handboeken Voorlichting Attenderen
Linkjes maken? Probleem: (nog) geen standaard citeermethode. Voor uitspraken bijvoorbeeld: Tijdschrift-vindplaatsen Tripletten LJN of ECLI Door elkaar, foutief gespeld, etcetera Technisch niet geëxpliciteerd (platte tekst) Oplossing: voed de auteurs op Oplossing: menskracht Oplossing: link-extractors.
Link-extractor voor jurisprudentie Detecteren mogelijke onderdelen van citatie (m.b.v. reguliere expressies) LJN (ECLI) Datum Zaaknummer Vindplaatsen Gerechtsnamen Normaliseren Canonicaliseren.
32
Link-extractor voor wetgeving
U S A G E User interfaces Special collections Statistics and other advanced stuff Linked open data P R O D U C T I O N Adding links > 5 star Adding URIs > 4 star Conversion > 3 star 5 star data 1/2 star data
Cool apps for your tablet
U S A G E User interfaces Special collections Statistics and other advanced stuff Linked open data P R O D U C T I O N Adding links > 5 star Adding URIs > 4 star Conversion > 3 star 5 star data 1/2 star data
Selectie en relevantie Wat is een representatieve selectie? Door explosie van gepubliceerde uitspraken wordt selectie van input-probleem steeds meer output-probleem Relevantieprobleem uit de information retrieval.
Wat is relevantie? Systeemrelevantie of algoritmische relevantie Wat vindt de (tekstuele) zoekmachine passend? Onderwerpsrelevantie Op basis van taxonomie Cognitieve relevantie of toepasbaarheid Aansluitend op persoonlijke informatiebehoefte Situationele relevantie Helpt het bij oplossen probleem? Domeinrelevantie Belang dat domeinexperts aan informatie hechten.
Domeinrelevantie 300.000 uitspraken op Rechtspraak.nl Vele meer in interne databanken Wat is belangrijk? Bagatelzaken vs. de canon van het recht Juridisch belang als zoek-/filtercriterium.
Meten juridisch belang Beoordelingscommissie? Arbeidsintensief Continue actualisering Onenigheid De hele crowd? Beoordelen is wat anders dan liken Model for Automated Rating of Case Law (MARC). Maakt o.m. gebruik van de impliciete oordelen van de juridische crowd, te vinden in linked data.
Regressie-analyse Predictors Regressor Geslacht Aandoening X Leeftijd Eerdere ziektes Omgevingsfactoren Algemene gesteldheid Bereken de kans op aandoening X, gegeven de waarde van de predictors Generalized lineair/nonlineair model.
Publicatieperiode Transitieperiode Citatieperiode Karakter Uitspraak ziet levenslicht Studie en commentaar Voortdurende roem of geleidelijke vergetelheid Duur Eén week Drie maanden Oneindig Regressor Publicatie m.u.v. Rechtspraak.nl Predictors Uitgaande jurisprudentiecitaties Uitgaande wetsverwijzingen Enkel- / meerv. kamer Lengte Publicatie op Rechtspraak.nl Nieuwsbericht op website Gerechtstype Rechtsgebied Gewogen gemiddelde van: MARC-publicatieperiode MARC-citatieperiode afhankelijk van dag in transitieperiode. Citatie in rechtspraak en eenmalige literatuur in komende drie jaar Publicatie (gewogen) Annotatie (idem) Citatie in continue literatuur (logaritmisch) Citatie in eenmalige literatuur (idem + gew. voortschr. gem.) Citatie in rechtspraak (idem) Leeftijd Gerechtstype Rechtsgebied
Eenvoud Waarden gaan van -0,4894170847 to 32,663963198 Groeperen in vijf klassen: MARC-1 tot MARC-5 Bepalen van de grenzen tussen de klassen hangt af van de inhoud van de database en is subjectief.
Vergelijking MARC-PP en MARC-CP Publicatieperiode Citatie- 1 2 3 4 5 Totaal period 1 71,1 0,1 0,0 0,0 0,0 71,2 2 3,9 11,1 0,9 0,0 0,0 15,8 3 0,0 4,8 4,8 1,2 0,0 10,9 4 0,0 0,5 0,7 0,4 0,2 1,7 5 0,0 0,0 0,1 0,1 0,1 0,3 Totaal 75,0 16,5 6,5 1,7 0,3 100,0 87,5% in zelfde klasse; 11,9% wijkt één klasse af; 0,6% twee klassen.
Hoe verder? Een moeizame verhouding tussen de bètavakken en het recht Aansluiting op nieuwe ontwikkelingen rond semantisch web, maar de juridische invalshoek is essentieel Inspiratie voor meer onderzoek en nieuwe toepassingen.
Dank voor de aandacht