Het TDM-voorbehoud: voorwaarden als instrument tegen AI-training

Uitgevers, nieuwsorganisaties en contentplatforms investeren voortdurend in het creëren van waardevolle, auteursrechtelijk beschermde content. Steeds vaker blijkt dat AI-systemen worden getraind met datasets die ook materiaal bevatten van deze partijen. Tekst- en datamining (TDM) is het geautomatiseerd kopiëren en verwerken van grote hoeveelheden digitaal materiaal met het doel informatie daaruit te extraheren, zoals patronen, trends of verbanden. Hierbij wordt het materiaal niet letterlijk overgenomen, maar kort gekopieerd en door de systemen geanalyseerd. De uitkomsten daarvan – zoals patronen en verbanden – worden gebruikt om het AI-model verder te trainen, zonder dat daar expliciete toestemming van de rechthebbende voor is gegeven.

Onder de huidige wetgeving mag dit, zolang er geen duidelijke juridische en technische beperkingen zijn gesteld. Content die vrij online beschikbaar is zonder expliciet TDM-voorbehoud kan in veel gevallen zonder toestemming worden gebruikt. Dit blog legt uit wat het TDM-voorbehoud inhoudt, hoe je deze kunt verwerken in contractuele voorwaarden én welke verdere maatregelen je kunt (of misschien wel moet) nemen, zodat het gebruik door AI-systemen kan worden uitgesloten.

1. Voorwaarden voor TDM

Sinds de implementatie van de DSM-richtlijn is TDM in Nederland geregeld in artikel 15n en 15o Auteurswet (Aw). Beide artikelen vormen uitzonderingen op het auteursrecht, maar richten zich op verschillende gebruikersgroepen. Artikel 15n Aw geeft onderzoeksinstellingen en cultureel erfgoedinstellingen het recht om TDM uit te voeren voor wetenschappelijk onderzoek. Dit mag zelfs als een rechthebbende expliciet een voorbehoud heeft gemaakt. De wetgever wil hiermee innovatie en kennisontwikkeling bevorderen. Artikel 15o Aw bepaalt dat ook commerciële partijen TDM mogen toepassen, mits de werken rechtmatig openbaar zijn gemaakt én de rechthebbende geen TDM-voorbehoud heeft opgenomen. In de praktijk betekent dit dat technologiebedrijven en commerciële uitgevers content kunnen gebruiken, tenzij de rechthebbende duidelijk beperkingen heeft gesteld.

2. Het TDM-voorbehoud

Het TDM-voorbehoud is een juridische mogelijkheid voor rechthebbenden om te verbieden dat hun werk wordt gebruikt voor TDM door commerciële partijen. De wet stelt wel een belangrijke eis: het voorbehoud moet ''op passende wijze'' kenbaar worden gemaakt (artikel 15o lid 2 Aw). Met andere woorden: het moet zó duidelijk en zichtbaar zijn gemaakt, dat een geautomatiseerd systeem of hergebruiker er niet omheen kan.

3. Voorwaarden als juridische basis voor het voorbehoud

Een TDM-voorbehoud begint bij contractuele voorwaarden. In die voorwaarden wordt vastgelegd dat TDM zonder toestemming van de rechthebbende niet is toegestaan. Daarbij kan worden bepaald dat de content uitsluitend is bestemd voor normaal menselijk gebruik (zoals lezen, bekijken of raadplegen door natuurlijke personen) en niet voor geautomatiseerde verwerking of hergebruik door AI-systemen. Het is essentieel dat dit voorbehoud consequent in alle toepasselijke voorwaarden is opgenomen, ongeacht de wijze waarop de content wordt ontsloten. Of toegang wordt geboden via een website, een portal of een API: in alle gevallen moeten de voorwaarden het gebruik voor TDM uitsluiten.

Hieronder volgt een voorbeeldclausule met een AI-trainingsverbod. Deze bepaling richt zich specifiek op het uitsluiten van gebruik van content voor het trainen van AI-systemen.

“Het is uitdrukkelijk verboden om content (al dan niet op onderdelen) direct of indirect te gebruiken om een algoritmische toepassing te trainen of om daarmee anderszins de werking van die algoritmische toepassing te verbeteren. Dit verbod geldt onder meer maar niet uitsluitend voor de toepassing van tekst- en datamining zoals bedoeld in artikel 15o Auteurswet. Onder een ‘algoritmische toepassing’ wordt in deze voorwaarden verstaan: ieder AI-systeem en AI-model zoals bedoeld in Verordening EU 2024/1689 (AI Verordening), met inbegrip van AI-systemen en AI-modellen voor algemene doeleinden, ongeacht of dit AI-systeem of dit AI-model onder het territoriale toepassingsbereik van de AI Verordening valt.”

“Onder ‘content’ wordt verstaan: alle werken, databanken, datasets, documenten, tekstbestanden, afbeeldingen, geluidsfragmenten, video-opnamen, code (inclusief bron- en objectcode), software, metadata, logbestanden, en alle andere al dan niet auteursrechtelijk beschermde informatie die beschikbaar wordt gesteld of gebruikt binnen het kader van de overeenkomst, ongeacht de drager of wijze van ontsluiting.’’

TDM-verklaring

Bij het maken van een TDM-voorbehoud moet rekening gehouden worden met het verschil tussen browse-wrapping en click-wrapping. Bij openbare websites is het lastig om bezoekers aan voorwaarden te binden via browse-wrapping. Hierbij gaat men uit van het feit dat een bezoeker een website bezoekt en gebruikt en daardoor impliciet de voorwaarden aanvaardt die ergens op de website vermeld staan. In de voorwaarden staat vaak een zin als ‘Door gebruik te maken van onze website gaat u akkoord met de voorwaarden’. De rechter accepteert dat nauwelijks, omdat er geen sprake is van echte instemming. Bij click-wrapping gaat de gebruiker actief akkoord, bijvoorbeeld door bij het aanmaken van het account de voorwaarden te accepteren. Voor gewone websites zonder login kan een alternatief zijn om een duidelijke TDM-verklaring te plaatsen, waarin expliciet staat dat tekst- en datamining is voorbehouden. Zo wordt voldaan aan artikel 15o Aw zonder dat bezoekers contractueel gebonden hoeven te worden.

4. Zorg dat crawlers het ook snappen: voeg technische opt-outs toe

Een louter juridisch voorbehoud is niet voldoende zichtbaar voor crawlers. Er moet daarom ook een machineleesbaar voorbehoud worden toegevoegd. Dat kan bijvoorbeeld door robots.txt, metatags of HTTP headers toe te voegen. Ook kunnen bekende AI-bots worden geblokkeerd op IP-niveau.

5. AI-training in de praktijk: bestaande content wordt al gebruikt

De meeste grote taal- en beeldmodellen worden getraind op openbare datasets, zoals Common Crawl, LAION of GitHub-dumps. Deze bronnen bevatten miljarden webpagina’s die toegankelijk zijn voor crawlers. Veel auteursrechtelijk beschermde content is al zonder toestemming verwerkt. Daar zijn nu procedures over aanhangig. Zo spande Getty Images een rechtszaak aan tegen Stability AI en procedeert The New York Times tegen OpenAI. In Nederland is door de Raad voor Cultuur een adviestraject gestart over de impact van AI op de sector.

Zonder contractuele én technische grenzen is het juridisch lastig om hergebruik tegen te houden - ook achteraf. Het ontbreken van een TDM-voorbehoud betekent feitelijk een stilzwijgende toestemming.

6. Welke stappen zijn nu mogelijk?

  • Neem een duidelijk TDM-voorbehoud op in de algemene voorwaarden;
  • Is het niet mogelijk (of niet wenselijk) om gebruikers aan voorwaarden te binden? Plaats dan een duidelijke losse TDM-verklaring op de website;
  • Stel robots.txt en metatags in overeenkomstig het TDM-beleid;
  • Zorg voor een consistente toepassing van het TDM-beleid in alle voorwaarden;
  • Houd toezicht op content en activiteiten van crawlers en AI-bots.

Zonder een expliciet TDM-voorbehoud hebben AI-systemen de ruimte om content te gebruiken voor trainings- en analysedoeleinden. Met een duidelijk voorbehoud en aanvullende technische maatregelen kan worden voorkomen dat materiaal zonder toestemming wordt hergebruikt in AI-systemen.

ICTRecht heeft een tool ontwikkeld waarmee een TDM-beleid kan worden gegenereerd. Kom je er zelf niet uit? Dan helpen onze contractspecialisten je graag verder.

Neem contact op

 

Terug naar overzicht