Legal big data - Toepassingen voor de rechtspraktijk en juridisch onderzoek

Auteur(s): Bron:

Samenvatting

Juridische documenten als wetgeving, jurisprudentie, beleidsstukken en wetenschappelijke artikelen kunnen worden gekarakteriseerd als legal big data: het zijn grote hoeveelheden, datatechnisch gezien ongestructureerde, gegevens.[1] Door recente technologische ontwikkelingen worden deze documenten steeds beter toegankelijk en doorzoekbaar. Hierdoor ontstaan verschillende mogelijkheden om de rechtspraktijk en juridisch onderzoek anders in te richten. In deze bijdrage wordt beschreven wat legal big data is en welke nieuwe perspectieven dit met zich meebrengt.[2] Daarbij worden verschillende toepassingen van legal big data voor de rechtspraktijk en juridisch onderzoek beschreven. In het bijzonder wordt ingegaan op kwantitatieve juridische voorspellingsmodellen, het versnellen van juridisch onderzoek en het verbeteren van wet- en regelgeving. Ook de gevolgen van deze ontwikkelingen voor juristen en hun werkzaamheden worden kort besproken.

Wat is legal big data?

Big data De term ‘big data’ verwijst in de eerste plaats naar de enorme omvang van de hoeveelheden gegevens. Echter, wat grote hoeveelheden gegevens zijn voor de een (bijvoorbeeld een strafzaak van 600 ordners),[3] kunnen slechts kleine hoeveelheden zijn voor een ander (bijvoorbeeld het boekenproject van Google, waarbij een scanrobot 1000 pagina’s per uur scant).[4] Er is geen minimale hoeveelheid vereist om van big data te kunnen spreken, maar het is wel duidelijk dat het gaat om vele terabytes (TB), petabytes (PB) en zelfs exabytes (EB) met gegevens.[5] Stephens et al. (2015) vergeleken vier big data–terreinen en stelden de vraag wie over een paar jaar de ‘grootste’ zal zijn: astronomie (opslag 1 EB jaarlijks), Twitter (1-17 PB), YouTube (1-2 EB) of genomics (2-40 EB).[6] Opslaan, verwerken en analyseren van big data vereist overigens speciale technologie. Voor de werking hiervan, wordt verwezen naar beschikbare literatuur.[7] Voorbeelden die illustreren waar het om gaat bij big data zijn er inmiddels legio. We noemen er enkele:

– Op medisch terrein is de Google griepanalyse bekend: door zoekgedrag van burgers te analyseren kon sneller dan via de verzameling van epidemiologische gegevens de loop van een griepepidemie voorspeld worden.[8]

– Met behulp van stappentellers ingebouwd in smartphones vonden onderzoekers patronen in obesitas.[9] Ze gebruikten gegevens van ruim 700 000 mensen uit 111 landen in een onderzoek naar fysieke activiteiten van mensen. Het ondervragen van dergelijke aantallen mensen is niet alleen een schier onmogelijke opgave en zeer kostbaar, maar kent ook fikse meetproblemen, waaronder gebrekkige antwoorden (weet iemand wel hoeveel hij loopt) en wenselijke antwoorden.

– De Global Database of Events, Language and Tone (GDELT)10 is een open databank met gegevens van nieuwsmedia en sociale media in meer dan honderd talen. Hiermee werd onder meer getracht het verloop van de Arabische lente te voorspellen.[11] 

– Op basis van zoekgedrag bleek het mogelijk trends in faillissementen in Nederland te voorspellen die bijna volledig in overeenstemming waren met de ‘echte’ faillissementscijfers van het CBS.[12]

De term big data wordt doorgaans niet alleen gebruikt om grote hoeveelheden gegevens aan te duiden, maar ook om aan te geven dat het om een technologische ontwikkeling of zelfs versnelling gaat.[13] Daarmee zit het concept big data volgens sommigen in ongeveer dezelfde categorie als de industriële revolutie, halfgeleiders, nanotechnologie, robotica en het internet.[14] In de whitepapers van het VN Global Pulse initiatief betreft het begrip big data niet alleen de data en de analysemethoden, maar ook het dataecosysteem van met elkaar verbonden organisaties en personen die de gegevens genereren, analyseren en gebruiken.[15]

Big data is doorgaans niet het gevolg van een gestage groei in hoeveelheden beschikbare data, maar het gevolg van exponentiële groei. Dit is het resultaat van de wet van Metcalfe, die stelt dat de waarde van een netwerk kwadratisch toeneemt met het aantal aangesloten apparaten.[16] Neem bijvoorbeeld sociale media. Wanneer er drie personen op een platform zitten, zijn er drie 1-op-1 relaties tussen deze personen om met elkaar communiceren. Wanneer er vier personen op het platform zitten, zijn er opeens zes 1-op-1 relaties. Met die ene extra gebruiker neemt het aantal mogelijke groepen zelfs toe van vier naar elf.

Onderscheidende aspecten van big data zijn de zogeheten 3 V’s:[17]

– Volume: big data gaat om grote hoeveelheden data, er worden geen steekproeven genomen.

– Velocity: (snelheid): big data is doorgaans real-time en betreft soms streaming data die niet wordt vastgelegd of opgeslagen.
– Variety: (verscheidenheid): big data kan ongestructureerde data betreffen in verschillende vormen, zoals tekst, cijfers, beelden (fotobeelden en camerabeelden) en geluid.

Legal big data

Waarom is dit alles nu interessant voor juristen? Veel juristen zijn niet snel geneigd te zeggen dat ze met data werken of gegevens analyseren – dat is vaak iets voor mensen in andere disciplines. Dat beeld komt ook naar voren uit de resultaten van een uitgebreide landelijke enquête onder Nederlandse rechtswetenschappers die eerder in dit tijdschrift werden gepubliceerd.[18] Daaruit blijkt dat rechtswetenschappers hun onderzoek nauwelijks associëren met exacte wetenschappen, al is er wel een duidelijke toenadering tot de sociale wetenschappen te bespeuren.

Kortom, veel juristen zien zichzelf niet als een beroepsgroep die werkt met data. Toch is niets minder waar. Het juridische werk impliceert nagenoeg het werken met big data: het gaat om grote hoeveelheden gegevens over vele jaren, soms uit meerdere landen (volume – omvangrijke teksten), die vaak (in technologisch opzicht)[19] ongestructureerd zijn (variety – verschillende formaten). Juridische documenten, waaronder wetgeving, jurisprudentie, beleidsstukken en wetenschappelijke artikelen, kunnen om die reden niet alleen worden beschouwd als data, maar zelfs als big data. Dit is wat we aanduiden als ‘legal big data’,[20] met excuses voor het anglicisme.[21]

Juridische documenten zijn er al sinds eeuwen. Maar in tegenstelling tot in het verleden zijn tegenwoordig veel juridische documenten gedigitaliseerd of digitaal aangemaakt.[22] In het eerste geval (bijvoorbeeld wanneer oude documenten worden gescand) resulteert dit in een betere ontsluiting van de documenten. In het tweede geval (wanneer nieuwe documenten digitaal worden aangemaakt), resulteert dit bovendien in een betere doorzoekbaarheid van de documenten. Deze toegankelijkheid is sterk verbeterd in de afgelopen decennia en veel documentatie die voorheen slechts op papier en via een beperkt aantal exemplaren beschikbaar was, is nu online beschikbaar voor iedereen die erin is geïnteresseerd. Ook de doorzoekbaarheid is sterk verbeterd. Via big data technologie is het steeds beter mogelijk voor computers (al is het soms nog erg lastig) om de tekst in gescande documenten (feitelijk foto’s in plaats van teksten) te herkennen. Dit gaat doorgaans via zogeheten Optical Character Recognition (OCR) ofwel tekstherkenningssoftware. Bij teksten die digitaal zijn opgesteld is deze vertaalslag niet nodig – deze kunnen meteen worden geanalyseerd door de computer. Het verschil is eenvoudig te zien in bijvoorbeeld een pdf-bestand: in een gescand pdf-bestand werkt de zoekfunctie niet, in een ‘geprint’ pdf-bestand wel.

Uiteraard gaat het bij big data analyses om meer dan alleen woorden zoeken. Met behulp van text mining, software die (op grote schaal) patronen in teksten kan herkennen, kunnen de juridische documenten verder geautomatiseerd worden geanalyseerd.[23] Zulke patroonherkenning wordt onder meer gebruikt om sociale media data te analyseren, bijvoorbeeld via sentimentanalyses, zie het voorbeeld van Coosto hieronder. Maar ook om de complexiteit van juridische documenten te analyseren.

Voor het juridisch domein biedt dit een aantal belangrijke nieuwe perspectieven. Het gebruik van legal big data schept de mogelijkheid om tot nieuwe juridische onderzoeksmethoden te komen. Naast onderzoek dat primair wordt gestuurd door hypotheses of theorieën is het ook mogelijk onderzoek uit te voeren dat (in eerste instantie) wordt gestuurd door de beschikbare gegevens. Daarbij kan geautomatiseerd worden gezocht naar verbanden in juridische documenten, bijvoorbeeld naar omstandigheden die leiden tot een bepaalde strafmaat of naar factoren die bepalend zijn voor een civielrechtelijke schadevergoeding. Het zoeken naar zulke verbanden kan nieuwe, onverwachte resultaten opleveren. Daarnaast kunnen zulke geautomatiseerde analyses met grotere doelmatigheid en doeltreffendheid worden uitgevoerd. Hieronder zal op enkele voorbeelden worden ingegaan. Het is overigens een misverstand dat het hebben en analyseren van de data op zich zelf genoeg is en dat big data tegelijkertijd ‘the end of theory’ impliceert.[24]

Toepassingen voor legal big data

Om een beeld te geven van verschillende toepassingen van legal big data voor de rechtspraktijk en voor juridisch onderzoek worden hieronder drie verschillende voorbeelden besproken. Dit zijn respectievelijk kwantitatieve juridische voorspellingsmodellen, het versnellen van juridisch onderzoek en het verbeteren van wet- en regelgeving. 

Kwantitatieve juridische voorspellingsmodellen

Met behulp van legal big data is het mogelijk om de uitkomsten van rechtszaken te kunnen voorspellen.25 In de Verenigde Staten worden rechters van het Amerikaanse Hooggerechtshof voorgedragen en benoemd door de president, waardoor ze een politieke kleur hebben. Wanneer er belangrijke uitspraken worden verwacht, is er veel speculatie in de media en door experts of de rechters uitspraak doen in lijn met hun politieke kleur of juist met een verrassende uitspraak komen. De uitspraken kunnen betrekking hebben op allerlei verschillende onderwerpen, zoals belastingrecht, milieurecht, discriminatie, patenten, vrijheid van meningsuiting, immigratie of strafrecht. Het Hooggerechtshof bestaat uit negen rechters en de uitkomst van een rechtszaak wordt door een gewone meerderheid bepaald. In 2004 organiseerde de Amerikaanse hoogleraar Theodore Ruger een wedstrijd om te kijken wie de uitspraken van het Amerikaanse Hooggerechtshof het beste kon voorspellen: een computer of een team van experts.26 De computer kreeg als input alle uitkomsten van alle rechtszaken die behandeld waren in het voorgaande jaar. Op basis van ruim 600 zaken werd een model gemaakt dat de uitkomst van nieuwe uitspraken moest voorspellen. Het team van experts bestond uit 83 gerenommeerde hoogleraren in het recht en ervaren advocaten. Zowel de computer als de experts moesten voorspellen wat elke individuele hoge rechter zou beslissen en welke meerderheid er zou ontstaan.

Het resultaat was verbluffend. Als het aankwam op het voorspellen van het stemgedrag van de individuele rechters, deden de computer en de experts het ongeveer even goed (68% respectievelijk 67% juiste voorspellingen), maar bij het voorspellen van de uitkomst van een rechtszaak versloeg de computer de experts met gemak. De computer haalde 75% juiste voorspellingen, terwijl de experts bleven steken op 59%, hetgeen nauwelijks beter is dan een muntje opgooien. Bij de rechters met een uitgesproken ideologie herkenden de experts snel welke kant het uit ging, maar bij gematigde rechters hadden experts moeite de juiste uitkomst te voorspellen, terwijl de computer toch patronen wist te ontdekken.

In 2014 kwamen professor Daniel Katz en zijn team met een sterk verbeterd model waarvoor bijna 8000 rechtszaken van de afgelopen 60 jaar als input waren gebruikt.[27] De voorspellingen haalden 70% juiste voorspellingen voor de zaken en 71% voor de individuele rechters. Dit model was onafhankelijk van de politieke en economische factoren van het moment. Ook was rekening gehouden met het feit dat rechters soms worden vervangen door andere rechters en met het punt dat sommige rechters in de loop der tijd ideologisch opschuiven. In 2016 publiceerden Britse en Amerikaanse wetenschappers ook een accuraat voorspelmodel (79% juiste voorspellingen) voor het Europees Hof voor de Rechten van de Mens.[28]

Het voorspellen van de uitkomsten van rechtszaken kan zeer nuttig zijn voor de rechtspraktijk, onder meer om in te schatten of het zinvol is om te procederen. Als de kansen op succes gering zijn, kan een raadsman bijvoorbeeld aansturen op een schikking voor zijn cliënt. Voorspelmodellen kunnen voor rechtswetenschappers ook een instrument zijn om vast te stellen wat het vigerend positieve recht is en hoe dit moet worden geïnterpreteerd in bepaalde casuïstiek. Voor rechtssociologen kunnen voorspelmodellen interessant zijn om bijvoorbeeld bloot te leggen welke niet-juridische factoren een rol spelen in vonnissen (als in: ‘Justice is what the judge had for breakfast’).29 Als wordt gekeken naar voorspellingen op terreinen waar nog geen of weinig rechtstheorie aanwezig is, kunnen de middels legal big data blootgelegde verbanden helpen theorieën (verder) te ontwikkelen.

Versnellen van juridisch onderzoek

Het voorspellen van uitkomsten van rechtszaken kan in de Verenigde Staten op meer belangstelling rekenen dan in Europa. Hier ten lande zullen betrekkelijk weinig juristen hun werk zien zoals de voormalige Amerikaanse opperrechter Oliver Wendell Holmes het zag: ‘prophesies of what the courts will do in fact, and nothing more pretentious, are what I mean by the law’.[30] Een heel ander domein waarin legal big data een bijdrage kan leveren aan de rechtspraktijk en juridisch onderzoek is middels het faciliteren van onderzoek. Daarbij wordt enerzijds gedoeld op voorbereidend juridisch onderzoek dat voorafgaat aan een rechtszaak (zoals het opzoeken van relevante bepalingen en jurisprudentie) en anderzijds juridisch wetenschappelijk onderzoek (zoals dat aan rechtenfaculteiten wordt bedreven). Legal big data kan beide vormen van juridisch onderzoek aanzienlijk versnellen.

Technologiebedrijf IBM ontwikkelde de supercomputer Watson, die in spreektaal gestelde vragen kan interpreteren en het antwoord kan geven na het raadplegen van een verzameling encyclopedieën, boeken, tijdschriften, wetenschappelijke artikelen en websites. In 2011 mocht Watson deelnemen aan de tv-quiz Jeopardy, waarin deelnemers het antwoord krijgen en daarbij zelf de correcte vraag moeten stellen. Watson mocht spelen tegen de twee beste spelers uit de geschiedenis van het programma. Een van hen wist in de eerste ronde nog gelijk te spelen tegen Watson, maar daarna werden alle rondes door de computer gewonnen. Watson lijkt erg op de boordcomputer van het ruimteschip Enterprise in Star Trek: als de bemanningsleden aan de computer een vraag stellen, kan de computer de vraag begrijpen en een antwoord geven. Dat was ooit sciencefiction, maar bestaat dus al.

Watson is een voorbeeld van kunstmatige intelligentie. De computer wordt gevoed met grote hoeveelheden gegevens en voorzien van software die patronen kan herkennen. Momenteel wordt ROSS, een variant op Watson die specifiek gericht is op het beantwoorden van juridische vragen, ontwikkeld door IBM. Soms wordt wel gedacht dat wetboeken veel exacter moeten worden gespecificeerd in axioma’s en definities wil het voor computers mogelijk zijn om ze te interpreteren, maar dat is niet nodig als er grote hoeveelheden gegevens beschikbaar zijn: de computer kan dan zelf op basis van context zulke definities en interpretaties onderscheiden. Overigens is dat bij rechters en rechtswetenschappers niet anders – ook zij geven voortdurend nadere duiding aan allerlei juridische begrippen en wetsartikelen.[31]

 

afbeelding

 

Een ander typisch (opnieuw) Amerikaans voorbeeld van het faciliteren van juridisch onderzoek middels legal big data is Ravellaw, een innovatief bedrijf dat toegang biedt tot legal big data voor juridisch onderzoek.[32] Ravellaw kan via internet worden geraadpleegd. Een typisch voorbeeld is het zoeken naar jurisprudentie, via het invoeren van zoektermen. Anders dan bijvoorbeeld het Nederlandse rechtspraak.nl wordt niet een lijst met zoekresultaten weergegeven, maar worden ook onderlinge verbanden tussen de uitspraken getoond. In Figuur 1 is een scherm weergegeven waarbij in Ravellaw is gezocht op privacy. Ravellaw toont alle uitspraken (in dit geval van het hooggerechtshof) waarin privacy een rol speelt. Ook de relevantie van elke zaak is weergegeven: grotere bollen naarmate een zaak relevanter is – landmark cases zijn de zaken Katz vs United States en Roe vs Wade. Onderaan in Figuur 1 is ook de frequentie van zaken weergegeven voor elk jaar. Hier komt een onverwacht (en niet nader verklaard) verband uit, namelijk een forse toename van uitspraken in 2010. Het gebruik van legal big data voor juridisch onderzoek heeft als voordeel dat de kans op het missen van belangrijke informatie (zoals een belangrijke rechtszaak) aanzienlijk afneemt.[33] Doordat grotere hoeveelheden jurisprudentie en andere juridische documentatie kunnen worden verwerkt (hetgeen iemand dagen of weken tijd zou kosten om door te nemen), kan de nauwkeurigheid en de betrouwbaarheid van juridisch onderzoek aanzienlijk worden vergroot. Verder kunnen, zoals hierboven aangegeven, nieuwe, onverwachte verbanden worden gevonden. Ook deze toepassing van legal big data kan een instrument zijn om vast te stellen wat het vigerend positieve recht is en hoe dit moet worden geïnterpreteerd in bepaalde casuïstiek. Bovendien kan deze toepassing worden ingezet om onderliggende rechtssociologische verbanden bloot te leggen, om rechtstheorieën verder te ontwikkelen en om weten regelgeving te ontwikkelen en/of verbeteren. Op dit laatste wordt hieronder verder ingegaan.

Verbeterde wet- en regelgeving

Een derde toepassing van legal big data betreft het terrein van verbeterde wet- en regelgeving. Onderdeel van bepaald juridisch werk (bijvoorbeeld van rechters, rechtswetenschappers, beleidsjuristen en wetgevingsjuristen) is immers ook rechtsvorming. Ook hier kan legal big data van toegevoegde waarde zijn, bijvoorbeeld wanneer legal big data wordt gecombineerd met big data afkomstig van sociale media. Gegevens op sociale media zijn ook big data, omdat het grote hoeveelheden (miljoenen gebruikers), ongestructureerde (tekst, foto’s, filmpjes), snelle (real-time berichtgeving) gegevens betreft. Deze gegevens kunnen worden gebruikt om te onderzoeken hoe grote hoeveelheden mensen over bepaalde zaken denken.

Een typisch voorbeeld is Coosto, een softwarebedrijf uit Eindhoven, dat zogeheten sentimentanalyses uitvoert op basis van gegevens op sociale media. Daarbij worden berichten op sociale media als Twitter en Facebook geanalyseerd met text mining (zie hierboven). Aan de hand van deze analyses wordt vastgesteld of de berichten positief of negatief zijn over een bepaald onderwerp. In Figuur 2 is een scherm weergegeven waarbij in Coosto is gezocht op Universiteit Leiden. In de voorgaande periode waren er 1194 berichten op sociale media, waarvan 14% positief en 7% negatief. Sentimentanalyses zijn voor rechtsvormers interessant om na te gaan welke voorstellen voor beleid, regelgeving en wetgeving kunnen rekenen op maatschappelijke acceptatie. Omdat publieke steun ook kan variëren door de tijd heen, kunnen sentimentanalyses ook worden gebruikt de juiste timing te kiezen voor het lanceren van nieuwe plannen, zoals wetsvoorstellen of nieuw beleid.[34] Dat er sprake is van real-time gegevens kan bijdragen aan het vergroten van de inzichten.

Legal big data kan niet alleen helpen bij het inschatten van maatschappelijke acceptatie, maar ook bij het verbeteren van de inhoud van rechtsvormend juridisch werk. Door juridische data te combineren met data over het gedrag van mensen wordt het mogelijk na te gaan welke regels (of welke typen regels) beter nageleefd worden en/ of beter te handhaven zijn. Een mooi voorbeeld is het lopen over het gras in plaats van het betegelde pad in een stadspark.[35] Als de paden te veel een omweg zijn, zijn mensen geneigd om hun route af te korten en een stukje over het gras te lopen. Na verloop van tijd slijt in het gras een nieuw pad uit en zijn mensen steeds meer geneigd deze nieuwe route te gebruiken. De uitgesleten paden laten een heel nieuw routenetwerk zien ten opzichte van het initiële geplaveide netwerk. Het nieuwe routenetwerk zou eenvoudig het oude netwerk kunnen vervangen en zal veel beter ‘nageleefd’ worden door de wandelaars.

Sociale media data kan tal van gedragspatronen blootleggen van mensen, waaronder hun reisbewegingen, hun aankoopgedrag, hun eetgedrag en hun lichaamsbeweging. In combinatie met legal big data kan dit inzichten opleveren over hoe mensen gedragsmatig zullen reageren op voorgestelde wet- en regelgeving.[36] Die gegevens kunnen ook worden gebruikt om achteraf beleid en wetgeving te evalueren.[37] Een typisch voorbeeld kan zijn het evalueren van een justitiële interventie, bijvoorbeeld het instellen van cameratoezicht in de binnenstad of het opleggen van een taakstraf aan winkeldieven. Net als bij het evalueren van medische interventies worden idealiter een testgroep en een controlegroep vergeleken, waarbij alleen de factor die wordt onderzocht, verschillend is. Een zogeheten randomized controlled trial kan in veel gevallen te kostbaar blijken of niet worden ingezet om ethische of praktische redenen. Niettemin kunnen met behulp van big data wel steeds beter achteraf controlegroepen worden samengesteld voor een quasi-experimenteel design. Naarmate de omvang van datasets toeneemt, kunnen er bijvoorbeeld meer ‘twins’ (individuen of groepen die in alles op elkaar lijken behalve het attribuut dat wordt onderzocht) worden gevonden. Ook doordat interventies gefaseerd worden ingevoerd, kunnen groepen ontstaan die met elkaar vergeleken kunnen worden. Daarmee wordt de zeggingskracht van evaluaties aanzienlijk sterker en dat kan weer bijdragen aan beleid of wetgeving dat evidence-based is. Verder kunnen er door de toename in de hoeveelheden beschikbare gegevens steeds fijnmazigere inzichten ontstaan, bijvoorbeeld dat een taakstraf voor winkeldieven alleen goed werkt bij jongeren van wie de ouders niet gescheiden zijn.

 

afbeelding

 

Het gebruik van legal big data voor het verbeteren van wet- en regelgeving kan bijdragen aan het werk van rechtssociologen, aan het ontwikkelen van rechtstheorieën en aan evidence-based rechtsvorming. Een recent voorbeeld is het gebruik van online zoekgedrag om kennis te verkrijgen over de bijdrage van een (Amerikaanse) beleidsinterventie aan het aanpakken van digitale piraterij.[38] In aansluiting hierop kan (legal) big data ook bruikbaar zijn bij het evalueren van wetgeving. Denk daarbij bijvoorbeeld aan het in kaart brengen van de aard en omvang van rechtszaken, gedragsveranderingen bij groepen burgers en/ of kostenbesparingen die verband houden met bepaalde wetgeving Niet ondenkbaar is dat de ontwikkelingen rondom ‘Quantified Self’, waarbij mensen met behulp van apps, sensoren en ‘injectables’ van alles over zich zelf vastleggen, hierin een belangrijke rol gaan spelen. Fawcett zegt het zo: ‘The last several years have seen an explosion of interest in wearable computing, personal tracking devices, and the socalled Quantified Self (QS) movement. Quantified self involves ordinary people recording and analyzing numerous aspects of their lives to understand and improve themselves’.[39] In de medische wereld wordt dit soort gegevens al gebruikt om te komen tot ‘personalized medicine’. Het is niet ondenkbaar dat iets dergelijks ook gebeurt bij het ontwerpen en invoeren van gedragsinterventies in de wereld van veiligheid en justitie.[40]

Gevolgen voor juristen

In de Verenigde Staten is het gebruik van legal big data al aanzienlijk verder doorgedrongen in de rechtspraktijk en de rechtswetenschappen. Inmiddels zijn de resultaten van deze ontwikkelingen ook al zichtbaar. De werkgelegenheid voor afgestudeerde rechtenstudenten is afgenomen, deels veroorzaakt doordat bedrijfsmodellen voor juridische dienstverlening aanzienlijk zijn veranderd. Door zowel toegenomen technologische mogelijkheden als de opkomst van deze nieuwe, innovatieve bedrijfsmodellen is de traditionele juridische dienstverlening onder druk komen te staan. Er zijn drie belangrijke veranderingen in de markt voor juridische dienstverlening, waarvan de eerste twee mogelijk worden gemaakt door legal big data en technologische ontwikkelingen:[41]

1. Er worden meer betaalbare, gestandaardiseerde, veralgemeniseerde diensten aangeboden, soms online.

2. Juristen zijn productiever geworden, waardoor dezelfde hoeveelheid werk door minder mensen kan worden gedaan.

3. Juristen hebben niet langer een alleenrecht op het aanbieden van juridische dienstverlening.

De arbeidsmarkt voor juristen wordt hierdoor op twee manieren minder aantrekkelijk. Ten eerste is er minder werkgelegenheid en ten tweede zijn salarissen minder aanlokkelijk, omdat werkgevers door een overschot aan werkzoekenden minder hoeven te betalen. Er worden in de VS jaarlijks bijna twee keer zoveel juristen opgeleid als er banen zijn.42 Hierdoor kunnen werkgevers de beste studenten selecteren na hun studie zonder diep in de buidel te hoeven tasten. Het gevolg is dat het steeds minder aantrekkelijk is geworden voor aankomende studenten om rechten te gaan studeren. Het aantal aanmeldingen van rechtenstudenten is in de periode 2005-2015 gedaald met maar liefst 40%.[43]

In Nederland lijkt de arbeidsmarkt voor juristen nog steeds prima. Sterker nog, het aantal juridische vacatures blijft stijgen.[44] Niettemin lijkt het goed voor juristen (en hun opleiders) om deze ontwikkelingen nauwgezet te volgen. De nieuwe manier van werken zal in toenemende mate gekarakteriseerd worden door lagere loonkosten, grootschalig maatwerk, recyclebare juridische kennis en alom aanwezige informatietechnologie.[45] Daardoor zal een deel van het werk kunnen worden uitbesteed aan andere beroepsgroepen, vergelijkbaar met een arts die bepaalde zaken ‘uitbesteedt’ aan de verpleging of de assistent. Bij de griffie staan vele arbeidsplaatsen op het spel, met name omdat meer zaken digitaal zullen worden afgehandeld.[46] Juridisch werk zal (ook op lange termijn) zeker niet overbodig of vervangbaar worden, maar zal wel van karakter veranderen door legal big data. Daardoor wordt enige basale technologische kennis steeds belangrijker voor juristen. Volgens sommigen blijft deze kennis nu achter.[47] Dit houdt niet in dat juristen moeten kunnen programmeren, maar wel dat ze enig zicht hebben op technologische ontwikkelingen en de (on)mogelijkheden die daarbij horen.[48]

Ter afsluiting

In deze bijdrage hebben we een beeld willen schetsen van de ontwikkelingen op het terrein van legal big data en de kansen die dit biedt voor juristen. Daarbij is concreet ingegaan op kwantitatieve juridische voorspellingsmodellen, het versnellen van juridisch onderzoek en het verbeteren van wet- en regelgeving. Gaan deze ontwikkelingen juristen en juridisch werk overbodig maken? Nee, de zeer grote hoeveelheden gegevens die beschikbaar komen, ook real-time, zullen niet per ommegaande alle vragen naar oorzakelijke verbanden beantwoorden, zonder zelfs maar behoefte te hebben aan verklarende theorieën. Ook in de gedigitaliseerde, gedataficeerde samenleving is meer nodig dan data om dingen te begrijpen en te verklaren.

Daarom is legal big data niet zozeer een vervangende aanpak voor de rechtspraktijk en juridisch onderzoek, maar vooral een aanvullende aanpak die kan versnellen en verdiepen. Het zou vreemd zijn als big data op tal van gebieden (waaronder geneeskunde, astronomie, sociale wetenschappen en psychologie) haar vruchten afwerpt en niet op het juridische domein. In de toekomst zal legal big data waarschijnlijk een steeds prominentere rol gaan vervullen in de rechtspraktijk en juridisch onderzoek. Onderdelen van het werk van juristen zullen daardoor mogelijk veranderen of verschuiven naar andere beroepsgroepen. Hoe dat gaat verlopen moet nog blijken, want de ontwikkelingen in big data staan allerminst stil. En tot slot: terecht wijst Prins[49] op ‘flinke hobbels en risico’s’, die met deze ontwikkeling gepaard gaan (zoals privacy, ethische zaken en monopoliemacht van data-conglomeraten).[50] Ook daar dient gedurig aandacht voor te zijn.

Eindnoten

1. Mr. dr. ir. B.H.M. Custers is UHD en hoofd onderzoek bij eLaw, het centrum voor recht en digitale technologie van de Universiteit Leiden. Eerder was hij bij het WODC hoofd van de afdeling criminaliteit, rechtshandhaving en sancties. Prof. dr. F. Leeuw is directeur van het WODC, Ministerie van Veiligheid en Justitie en hoogleraar Recht, Openbaar Bestuur en Sociaalwetenschappelijk Onderzoek aan de Universiteit van Maastricht.

2. Deze bijdrage gaat niet in op het reguleren van big data of data science, daarvoor wordt verwezen naar andere beschikbare literatuur, zie bijvoorbeeld P.H. Blok, Big data en het recht, Den Haag: Sdu 2017; B.H.M. Custers, ‘Data Dilemmas in the Information Society’, in: B.H.M. Custers, T. Calders, B. Schermer, T. Zarsky (red.), Discrimination and Privacy in the Information Society, nr. 3, Heidelberg: Springer 2013, p. 3-26; L. Moerel & C. Prins, ‘Privacy voor de homo digitalis’, in: Homo Digitalis, Preadviezen 2016 Nederlandse Juristen Vereniging 2016, p. 9-124, Deventer: Kluwer 2016.

3. Bijv. het passageproces: Hof Amsterdam 29 juni 2017, 23-000643-13, ECLI:NL:GHAMS:2017:2495. J. Meeus, ‘600 ordners over moord en doodslag in de onderwereld’, NRC Handelsblad 28 juni 2017.

4. S. Heyman, ‘Google Books: A Complex and Controversial Experiment’, New York Times 28 oktober 2015.

5. A. Gandomi & M. Haider, ‘Beyond the hype: Big data concepts, methods and analytics’, International Journal of Information Management, 2015, 35, p. 137-144.

6. Z.D. Stephens, S.Y. Lee, F. Faghri, R.H. Campbell, C. Zhai, M.J. Efron et al., ‘Big Data: Astronomical or Genomical?’, PLoS Biol 2015, 13(7): e1002195. https://doi.org/10.1371/journal.pbio.1002195.

7. Zie bijv. K.S. Candan & M.L. Sapino, Data management for multimedia retrieval, Cambridge: Cambridge University Press 2010; T. Calders & B.H.M. Custers, ‘What is data mining and how does it work?’, in: B.H.M. Custers et al. (eds.), Discrimination and privacy in the information society, Heidelberg: Springer 2013, p. 27-42.

8. J. Ginsberg, M.H. Mohebbi, R.S. Patel, L. Brammer, M.S. Smolinski & L. Brilliant, ‘Detecting influenza epidemics using search engine query data’, Nature 2009, 457 (7232): 1012–1014. Op deze studie kwam ook kritiek. Zie D. Butler, ‘When Google Got Flu Wrong’, Nature 2013, 494: 155–6. 

9. T. Althoff, R. Sosi , J.L. Hicks, A.C. King, S.L. Delp, J. Leskovec, ‘Large-scale physical activity data reveal worldwide activity inequality’, Nature 2017, DOI: 10.1038/nature23018.

10. P. Schrodt, Automated Production of High-Volume, Near-Real-Time Political Event Data. Paper presented at the New Methodologies and Their Applications in Comparative Politics and International Relations Workshop, Princeton University, 4-5 februari 2011.

11. K. Leetaru, ‘Did the Arab Spring Really Spark a Wave of Global Protests? The world may look like it’s roiling now, but the 1980s were far worse’, Foreign Policy 30 mei 2014.

12. F. Willemsen, & F. Leeuw, ‘Big Data, real world events and evaluations’, in: G. Petersson e.a. (red.), Big Data and evaluation, Piscataway NJ: Transaction Publishers 2016.

13. V. Mayer-Schönberger & K. Cukier, Big Data: A revolution that will transform how we live, work and think, New York: Houghton, Miffl in, Harcourt Publishing Company 2013.

14. In Duitsland wordt hiervoor de term Industrie 4.0 gebezigd, na de stoommachine, elektriciteit en computers, zie bijv. J. Jasperneite, ‘Was hinter Begriffen wie Industrie 4.0 steckt’, Computer & Automation 19 december 2012.

15. Website United Nations Global Pulse

16. A. Madureira, F. Den Hartog, H. Bouwman & N. Baken, ‘Empirical validation of Metcalfe’s law: How Internet usage patterns have changed over time’, Information Economics and Policy 2013, vol. 25, nr. 4, p. 246-256.

17. D. Laney, 3D Data Management: Controlling Data Volume, Velocity and Variety, Gartner: Stamford CT: META Group Inc 2001. Soms worden nog extra aspecten genoemd, zoals Veracity (hoe precies, betrouwbaar en valide zijn de data) en Value (de meerwaarde van de gegevens of analyses daarop).

18. W.H. van Boom & R.A.J. van Gestel, ‘Rechtswetenschappelijk onderzoek – een samenvatting van de uitkomsten van een landelijke enquête’, NJB 2015/960, afl . 20, p. 1336-1347.

19. In juridisch of taalkundig opzicht zijn de teksten doorgaans uiteraard wel gestructureerd. Ongestructureerd betekent hier dat ze, anders dan kwantitatieve gegevens over bijvoorbeeld demografi e, fi nanciën of criminaliteit die een vaste (cijfermatige) structuur hebben, in dát opzicht vormvrij zijn.

20. F.L. Leeuw & H. Schmeets, Empirical Legal Research, A Guidance Book for Lawyers, Legislators and Regulators, Cheltenham: Edward Elgar Publishing Inc. 2016, p. 8.

21. De term juridische big data vermijden we omdat dit een halfslachtige vertaling is.

22. C.M. Aarde & J.E.J. Prins, ‘Digitalisering binnen de rechtspraak’, RM Themis 2016, 2, p. 62-73.

23. K.B. Cohen & L. Hunter, ‘Getting Started in Text Mining’, PLoS Computational Biology 2008, vol. 4, nr. 1, p. 20.

24. C. Anderson, ‘The End of Theory: The Data Deluge Makes the Scientifi c Method Obsolete’, Wired 23 juni 2008

25. B.H.M. Custers, ‘Kunnen computers het wetboek interpreteren?’, in: B. de Graaf & A. Rinnooy Kan (red.), Hoe zwaar is licht? Meer dan 100 dringende vragen aan de wetenschap, Amsterdam: Balans 2017.

26. T.W. Ruger, P.T. Kim, A.D. Martin & K.M. Quinn, ‘The Supreme Court Forecasting Project: Legal and Political Science Approaches to Predicting Supreme Court Decisionmaking’, Columbia Law Review 2004, vol. 104, p. 1150.

27. D. Katz, M. Bommarito & J. Blackman, ‘Predicting the Behavior of the Supreme Court of the United States’, PLoS ONE 2014, vol. 12, nr. 4, e0174698.

28. N. Aletras, D. Tsarapatsanis, D. Preoţiuc-Pietro & V. Lampos, ‘Predicting judicial decisions of the European Court of Human Rights’, PeerJ Computer Science 2016, 2:e93.

29. S. Danziger, J. Levav & L. Avnaim-Pesso, ‘Extraneous factors in judicial decisions’, Proceedings of the National Academy of Sciences, 2011 vol. 108, nr. 17, p. 6889- 6892. Overigens zouden op deze manier ook hypothesen van (Amerikaanse) Legal Realists (uit de jaren 30-50 van de vorige eeuw) opnieuw getoetst kunnen worden, zie F.L. Leeuw & H. Schmeets, Empirical Legal Research, A Guidance Book for Lawyers, Legislators and Regulators, Cheltenham: Edward Elgar Publishing Inc. 2016.

30. Oliver Wendell Holmes Jr., ‘The Path of the Law’, 10 Harvard Law Review, 1897, 457, 461. Zie ook M. Radin, ‘The Theory of Judicial Decision: Or How Judges Think’, American Bar Association Journal 1925, vol. 11, p. 357-362.

31. B.H.M. Custers (2017), ‘Kunnen computers het wetboek interpreteren?’, in: B. de Graaf & A. Rinnooy Kan (red.) Hoe zwaar is licht? Meer dan 100 dringende vragen aan de wetenschap, Amsterdam: Balans. Ook relevant: in het bestuursrecht is inmiddels een toetsingskader ontwikkeld voor geautomatiseerde besluitvormingsprocessen, zie T. Barkhuysen & N. Jak, ‘Afdeling bestuursrechtspraak formuleert toetsingskader voor geautomatiseerde besluitvormingsprocessen’, Stibbeblog.nl 23 augustus 2017.

32. E. Eckholm, ‘Harvard Law Library Readies Trove of Decisions for Digital Age’, New York Times 28 oktober 2015. Zie ook G. van Dijck, ‘Legal research when relying on open access’, Law and Method, april 2016. In zijn Maastrichtse oratie (22 september 2017) werkt van Dijck een aantal zaken verder uit.

33. B.H.M. Custers, ‘Big Data in wetenschappelijk onderzoek’, Justitiële Verkenningen, vol. 2016, nr. 1, p. 8-21.

34. Voor opportunistisch gebruik van big data tijdens de Amerikaanse presidentsverkiezingen in 2016, zie: H. Grassegger & M. Krogerys, ‘The Data That Turned the World Upside Down’, Motherboard 28 januari 2017.

35. P. Ball, Critical Mass; How One Thing Leads to Another, New York: Farrar, Straus and Giroux 2004.

36. F. Leeuw, ‘Wetgeving, empirisch juridisch onderzoek en legal big data’, Recht der Werkelijkheid, 205 vol. 36, nr. 2, p. 50-65.

37. F. Willemsen & F.Leeuw, ‘Big Data, real world events and evaluations’, in: G. Petersson e.a. (red.), Big Data and evaluation, Piscataway NJ: Transaction Publishers 2016. Zie ook afgeronde en lopende WODC R&D projecten op Big Data gebied.

38. H.B.M. Leeuw, Punish, Seduce or Persuade. An Empirical Assessment of AntiPiracy Interventions, The Hague: Eleven International Publishing 2017. Zie ook zijn artikel in het Strafblad (in druk). Om de effecten van anti-piraterij maatregelen te onderzoeken werden overigens naast big data over zoekgedrag, ook gegevens uit vragenlijsten over attitudes, gedragsintenties en andere variabelen van studenten gebruikt.

39. T. Fawcett, ‘Mining the Quantified Self: Personal Knowledge Discovery as a Challenge for Data Science’, Big Data, 2015, vol. 3, nr. 4.

40. Zie bijv. C.H. de Kogel & L.J.M. Cornet, ‘Toepassingsmogelijkheden van Quantified Self-data’, Justitiële Verkenningen 2016, 42: 79-95.

41. M.R. Pistone & M.B. Horn, Disrupting Law School: How disruptive innovation will revolutionize the legal world, San Francisco: Christensen Institute 2016.

42. B. Tamanaha, Failing Law Schools, Chicago: University of Chicago Press 2012.

43. J. Gershman, ‘Law School Applicant Pool Still Shrinking’, The Wall Street Journal 23 april 2015.

44. Yacht, Trends en ontwikkelingen op de Legal arbeidsmarkt vierde kwartaal 2016, Amsterdam: Yacht 2017.

45. R. Susskind, Tomorrow’s Lawyers, Oxford: Oxford University Press 2013.

46. J.E.J. Prins, ‘Big data en de rechterlijke macht’, NJB 2015/1538, afl. 30, p. 2087.

47. Zie bijv. de noodkreet van het Hof Den Haag: H. Modderkolk, ‘Dringend gezocht: rechters met kennis van cybercriminaliteit’, de Volkskrant 3 augustus 2017. Ook in het bestuursrecht wordt aan de bel getrokken, zie A. Meuwese, ‘Grip op normstelling in het datatijdperk’, in: W. den Ouden, Algemene regels in het bestuursrecht, Meppel: Boom Juridische uitgevers 2017.

48. N.C. van Oostrom-Streep, ‘A wounded deer leaps highest', NJB 2016/2115, afl. 41, p. 3028; T. Barkhuysen, ‘De Homo Digitalis als uitdaging voor het recht’, NJB 2016/1071, afl. 22, p. 1527.

49. J.E.J. Prins, ‘Big data en de rechterlijke macht’, NJB 2015/1538, afl. 30, p. 2087.

50. Zie ook A.H. Vedder & B.H.M. Custers, ‘Whose responsibility is it anyway? Dealing with the consequences of new technologies’, in: P. Sollie & M. Düwell (eds.), Evaluating new technologies, New York: Springer 2009, p. 21-34.

Titel, auteur en bron

Titel

Legal big data - Toepassingen voor de rechtspraktijk en juridisch onderzoek

Auteur(s)

Bart Custers
Frans Leeuw

Permanente link

Huidige versie

https://www.openrecht.nl?jcdi=JCDI:ALT82:1