Home / Nieuws & Blogs / Hier met die data! Hoe zit dat nou precies met scraping?

Hier met die data! Hoe zit dat nou precies met scraping?

| 13 juli 2022

Overal ligt data. Tegenwoordig kan je misschien wel spreken van een ware informatie-overvloed.

Flink wat knappe koppen zien daarin een goudmijn. Zo kan het ordenen van die informatie-overvloed veel succes opleveren – denk bijvoorbeeld aan oplossingen die geautomatiseerd auto- en woningaanbod indexeren en weergeven. Ook lijken de kansen voor wat betreft die zee aan data met de opkomst en ontwikkeling van algoritmische toepassingen en kunstmatige intelligentie voor het oprapen te liggen.

Toch begeven we ons met het begrip ‘scraping’ in een juridisch grijs gebied. Er is geen concreet, uitgekristalliseerd leerstuk of juridisch kader aan de hand waarvan je eenvoudig een lijst van toegestane scrapingtoepassingen kunt duiden. Als je wilt nagaan of een bepaalde scrapingtoepassing toegestaan is – bijvoorbeeld omdat je een aanbodverzamelaar wil bouwen of je algoritme met scrapingdata wil trainen – is het daarom van belang om die vraag juist te benaderen vanuit het perspectief van de mogelijke juridische belemmeringen die in dat kader kunnen spelen.

  1. Beoordeling van de eindtoepassing van de te scrapen gegevens, bijvoorbeeld in het kader van de AVG, AI verordening of de relevante algoritme-gerelateerde bepalingen in de nieuwe Europese Digital Service Act Package valt buiten de scope van deze blog.

Overeenkomst

Een overeenkomst met een scrapedoelwit, bijvoorbeeld een website, zal in veel gevallen inhouden dat scraping verboden is, bijvoorbeeld via een IE- of fair-use bepaling. Als er sprake is van een overeenkomst met het scrapedoelwit is het van belang om met een jurist naar de betreffende afspraken te kijken alvorens te scrapen. Bevindt de informatie zich achter een login? Dan mag je er van uitgaan dat er altijd sprake is van een overeenkomst.

Auteursrecht

Wanneer het scrapedoelwit teksten, afbeeldingen en andere “eigen intellectuele scheppingen” bevat, hebben deze auteursrechtelijke bescherming, tenzij het feitelijke opsommingen betreft zoals woningoppervlak, prijs of aantal slaapkamers. Auteursrechtelijke bescherming betekent dat de betreffende informatie niet zonder toestemming openbaargemaakt of verveelvoudigd mag worden.

Er bestaan uitzonderingen op het auteursrecht. Zo kan een auteursrechthebbende niet tegen gebruik van zijn scheppingen optreden voor zover dat binnen het citaatrecht valt. Het citaatrecht houdt in dat een beschermd werk mag worden aangehaald ter ondersteuning van aankondiging, polemiek, wetenschappelijke verhandeling of uiting met vergelijkbaar doel. Het mag niet slechts om versiering gaan, moet inhoudelijk relevant zijn en ter ondersteuning dienen van het doel. Voor “aankondiging” is belangrijk dat de lezer van het citaat wordt aangezet tot bezoeken originele bron. Zie bijvoorbeeld: www.gaspedaal.nl, waar alle verzamelde advertenties verwijzen naar de originele vindplaats.

Hele werken overnemen mag niet. In het geval van tekst kan het overnemen van passages geoorloofd zijn. In het geval van afbeeldingen kan een enkel voorbeeldexemplaar – in lagere resolutie dan het origineel – geoorloofd zijn, maar dient het overnemen in volledige resolutie of het overnemen van een volledige verzameling afbeeldingen van een bepaald scrapingobject te worden vermeden. Wat een geoorloofd citaat is moet per geval worden beoordeeld.

Databankenrecht

Een andere mogelijke belemmering is te vinden in het databankenrecht. De databankenwet definieert een databank als “een verzameling van werken, gegevens of andere zelfstandige elementen die systematisch of methodisch geordend en afzonderlijk toegankelijk zijn”. Een verworven databankenrecht beschermt tegen het (integraal of grotendeels) overnemen, ongeautoriseerd opvragen en hergebruiken van de opgenomen gegevens.

Om een databankrecht te verwerven, moet de verkrijging, de controle of de presentatie van de inhoud van de verzameling in kwalitatief of kwantitatief opzicht getuigen van een substantiële investering (geld en/of arbeid). Wanneer de investering of databank een bijproduct (“spin-off”) is, wil dat zeggen dat er van substantiële investering geen sprake is: er dan niet geïnvesteerd is in de databank, maar juist in iets anders waarbij de databank slechts een bijkomstigheid is.

Privacy

Een scrapingdoelwit kan natuurlijk ook persoonsgegevens bevatten. Sterker nog: deze zijn voor veel scrapers uitermate interessant. Scraping van persoonsgegevens is een verwerking en mag dus van de AVG slechts plaatsvinden met een passende grondslag. Omdat scraping in veel gevallen impact heeft op betrokkenen waar de scraper verder geen relatie mee heeft, is de grondslag van het “gerechtvaardigd belang” meestal de enige optie. Of de daarvoor benodigde belangenafweging in het voordeel van de scraper uitvalt betreft in alle gevallen een casuïstische toets waar een privacyexpert bij moet worden betrokken.

Het gebrek aan een relatie met de betrokkene zorgt voor een aanvullend probleem in het kader van de privacywetgeving. Namelijk dat de plicht om de betrokkenen over de verwerking te informeren, opgenomen in artikel 14 AVG, in veel gevallen onmogelijk of onwerkbaar is. Lid 5 van dat artikel bevat in dat kader mogelijke uitzonderingen op deze plicht, bijvoorbeeld als door naleving de gerechtvaardigde belangen in gedrang zouden komen. Of een dergelijke uitzondering van toepassing is betreft wederom een case-by-case beoordeling, welke vaak sterk samen zal hangen met de in de vorige alinea genoemde belangenafweging.


Meer lezen over dit onderwerp? Lees verder: