David en Goliath: kan The New York Times een vuist maken tegen AI-giganten?

Na intensieve onderhandelingen is de AI Act eindelijk definitief! Hoewel aanbieders van AI nu weten waar ze aan toe zijn qua verplichtingen, blijft ook bestaande wetgeving onverkort van kracht. AI zal dus ook haar stempel drukken op bijvoorbeeld intellectuele eigendom, privacyrecht of strafrecht. Bij gebrek aan specifieke bepalingen over AI, is het wachten op het juridisch oordeel van een rechter met betrekking tot andere rechtsgebieden.  In de Verenigde Staten zal op korte termijn duidelijkheid geschept worden ten aanzien van de verhouding tussen auteursrecht en AI.

De casus The New York Times tegen OpenAI en Microsoft

De beroemde krant The New York Times is namelijk een rechtszaak aangespannen tegen magnaten OpenAI (ChatGPT) en Microsoft (Copilot) wegens vermeende auteursrechtinbreuk. In de optiek van The New York Times wordt voor het ‘trainen’ van de large language models – die de drijvende kracht achter ChatGPT en Copilot zijn – gebruik gemaakt van diens auteursrechtelijk beschermde artikelen.

De werkwijze van OpenAI en Microsoft bestempelen zij als een bedreiging voor de hoogwaardige journalistiek waarvoor zij flink geïnvesteerd hebben, terwijl de AI-modellen meeliften zonder dezelfde lasten te hoeven dragen. De AI-modellen van OpenAI en Microsoft ‘leren’ van de schrijfwijze en inhoud van de artikelen van The New York Times, waarna zij deze nauw kunnen samenvatten of reciteren. Als gevolg daarvan mist de The New York Times naar eigen zeggen inkomsten in de vorm van advertenties, licenties en abonnementen.

Het betoog van The New York Times klinkt redelijk. Voor gebruikers van ChatGPT en Copilot is het ideaal dat zij gratis, snel en gemakkelijk informatie kunnen extraheren, maar gerenommeerde kranten vrezen dat de opkomst van dit soort AI-modellen hun doodsteek is. In het Amerikaanse recht wordt bij de beoordeling van auteursrechtinbreuken uitgegaan van het ‘fair use’-principe. Er wordt dus gekeken of het gebruik door de inbreukmaker ‘eerlijk’ is. In de gegeven situatie lijkt de claim van The New York Times kansrijk, omdat zonder toestemming gebruik is gemaakt van artikelen waarvoor doorgaans betaald moet worden. Hoe zit dit in Nederland? Kunnen (digitale) kranten de handdoek in de ring gooien kunnen zij een vuist maken tegen de handelspraktijken van partijen als OpenAI en Microsoft?

Nederlands auteursrecht

Daarvoor is allereerst van belang dat de gebruikte krantenartikelen überhaupt auteursrechtelijke bescherming genieten. In eerdere bijdragen is verkend dat deze drempel niet erg hoog ligt: hieraan is reeds voldaan als ondenkbaar is dat een tweede auteur tot exact hetzelfde stukje tekst komt.1  Ook moet sprake zijn van een handeling die het werk exploiteert. Dit is het geval als het werk openbaar wordt gemaakt of (al dan niet in gewijzigde vorm) verveelvoudigd wordt.

Wat een kanttekening verdient, is dat het auteursrecht de ‘vorm’ beschermt en niet de ‘inhoud’. Dit houdt in dat iemand kennis mag nemen van het onderwerp van een krantenartikel en hier zelf iets over mag schrijven, zolang het concrete, geschreven artikel niet gereproduceerd wordt. Iemand kan een artikel lezen over een actueel onderwerp, deze kennis tot zich nemen en vervolgens een eigen artikel schrijven zonder dat sprake is van auteursrechtinbreuk. Je zou dus kunnen stellen dat een AI-model kennis mag nemen van bepaalde artikelen, zolang de uiteindelijk output geen afgeleide van het originele artikel is. Waar een mens kennis kan internaliseren, moet een large language model getraind worden door het te voorzien van input. Large language models dienen de geleverde input dus te verveelvoudigen om ervan ‘te leren’, waardoor inherent sprake is van auteursrechtinbreuk.

Uitzonderingen op het auteursrecht: tekst- en datamining

De Auteurswet voorziet echter ook in enkele uitzonderingen. Als iemand een handeling verricht die valt onder een uitzonderingssituatie, is geen sprake van auteursrechtinbreuk.  Zo wordt in art. 15o Auteurswet ‘tekst- en datamining’ uitgezonderd. Daarvoor is van belang dat het werk rechtmatig is verkregen en 'het gebruik niet uitdrukkelijk op passende wijze is voorbehouden'. Dit houdt in dat op een passende manier moet worden aangegeven dat de artikelen van The New York Times niet bestemd zijn om gebruikt te worden voor tekst- en datamining. Het is onduidelijk of aan deze voorwaarden is voldaan.

De artikelen van The New York Times bevinden zich achter een betaalmuur en zijn niet vrij toegankelijk voor het publiek. Men kan zich afvragen of sprake is van rechtmatige verkrijging als een artikel achter een betaalmuur voor eenieder beschikbaar wordt gesteld in gewijzigde vorm. Naar mijn mening is dat niet het geval. Als informatie die voortkomt uit hoogwaardige journalistiek via ChatGPT of Copilot beschikbaar is, wordt een nieuwe doelgroep bereikt. Deze doelgroep heeft echter geen abonnement afgesloten bij The New York Times, wat normaal gesproken een vereiste is om toegang te hebben tot de artikelen. Daarnaast ontvangt The New York Times geen abonnementsgelden voor deze lezers en kunnen zij mogelijk geen hoogwaardige journalistiek meer bedrijven, waardoor de prikkel om abonnee te worden zal verkleinen. Om bovenstaande redenen acht ik de werkwijze van OpenAI en Copilot niet te kwalificeren als 'rechtmatige verkrijging'.

Ook de tweede voorwaarde is interessant: The New York Times kan op passende wijze aangeven aan OpenAI en Copilot dat de artikelen niet bestemd zijn om te gebruiken voor tekst- en datamining. Dit zou bijvoorbeeld kunnen bestaan in een disclaimer bij elk artikel dat het artikel niet gebruikt mag worden door large language models of op een technische wijze die machineleesbaar is. De voorkeur zal doorgaans liggen bij laatstgenoemde optie, omdat de 'crawler' van large language models dan automatisch geblokkeerd worden. The New York Times heeft hierop een voorschot genomen op haar website, nu de crawler van OpenAI geblokkeerd wordt.

Conclusie

Er staat al met al een spraakmakende zaak op de planning in de Verenigde Staten. Het is afwachten wat de rechter daar zal oordelen over het gebruik van auteursrechtelijk beschermde werken als trainingsdata voor een large language model. In het Nederlandse recht lijkt dit op het eerste gezicht een auteursrechtinbreuk te zijn, al zouden partijen als OpenAI en Microsoft zich wellicht kunnen beroepen op de ‘tekst- en datamining’-uitzondering. Wat digitale kranten als The New York Times kunnen doen, is het ‘scrapen’ van beschermde werken uitdrukkelijk verbieden.

https://www.ictrecht.nl/blog/creatieve-grenzen-auteursrecht-in-het-tijdperk-van-ai


Meer leren over AI? Bekijk ons aanbod:

Meer informatie

Terug naar overzicht