Home / Nieuws & Blogs / BigDatamaandag deel 7: De vijf typen Big Data

BigDatamaandag deel 7: De vijf typen Big Data

| 18 augustus 2014

Big Data, het begrip waar eindeloos over wordt geschreven en gediscussieerd. Hype of toekomst? Toekomst of realiteit? Wat de speculaties ook zijn, de komende weken zal er een blogserie over Big Data en de juridische impact ervan verschijnen. Want hoewel het combineren van enorme datasets wellicht in een eerste instantie onschuldig lijkt, heeft dit wel degelijk een juridische impact wanneer deze data ook informatie over personen bevat.

In deel 1 van deze blogserie heb ik verteld over wat Big Data nou eigenlijk is en wie er gebruik van maakt. Maar aan het gebruik van Big Data zijn ook grenzen gebonden. Als een database gegevens over personen bevat, is de Wet bescherming persoonsgegevens van toepassing. Deze wet stelt bepaalde eisen aan het verwerken van persoonsgegevens, namelijk een rechtsgeldige grondslag en een welbepaald, uitdrukkelijk omschreven en gerechtvaardigd doel.

Deze eisen en grenzen zijn uiteraard erg belangrijk, maar nog belangrijker is misschien wel de vraag: bij welke ‘soorten’ Big Data worden er persoonsgegevens verwerkt? Big Data kan onderverdeeld worden in vijf typen Big Data: 1) Machine to Machine Data, 2) Big Transaction Data, 3) Biometric Data, 4) Human-Generated Data en tot slot 5) Web & Social Media Data. Elk type Big Data bevat weer andere soorten gegevens.

1)      Machine to Machine Data.

Dit eerste type Big Data ziet op het uitwisselen van data op een gedeeltelijke of gehele geautomatiseerde wijze. Voorbeelden hiervan zijn slimme meters of noodoproep systemen voor in huis of in de auto. Het verzenden van deze gegevens vindt plaats tussen twee apparaten. Er wordt bij dit type Big Data een onderscheid gemaakt tussen technische- en meetgegevens. Bij technische gegevens kan gedacht worden aan gegevens die toezien op het onderhoud van apparatuur (bijvoorbeeld de batterijstatus en software). Bij meetgegevens daarentegen worden persoonsgegevens verwerkt om een meetstand vast te stellen. Zo zal een factuuradres gekoppeld worden aan het apparaat in combinatie met NAW-gegevens en de EAN-code, maar ook customer ID en IP-adres.

2)      Big Transaction Data.

Onder deze categorie Big Data vallen verschillende soorten transactiegegevens. Hierbij kan gedacht worden aan claims bij de verzekering, telecommunicatiegegevens maar ook transactiegegevens voor de huishoudelijke vaste lasten. Dit type Big Data bevat veel verschillende persoonsgegevens. Zo zijn bankrekeningnummers, telefoonnummers, NAW-gegevens maar ook een Imeinummer aan te merken als persoonsgegevens. Bovendien bevat deze categorie data zelfs bijzondere persoonsgegevens. Data uit zorgverzekeringclaims kan namelijk persoonsgegevens bevatten over iemands gezondheid. Voor bijzondere persoonsgegevens geldt een hoger beschermingsregime.

3)      Biometric Data.

Dit type opgeslagen Big Data bevat waarschijnlijk de meest gevoelige data van de vijf typen Big Data. Biometric Data kan opgedeeld worden in twee vormen van persoonsgegevens: fysiologische kenmerken (o.a. scan van de iris, het gezicht, vingerafdrukken en een palmafdruk) en gedragskenmerken (stem, handschrift en handtekening). Deze twee vormen van persoonsgegevens zijn bijzondere persoonsgegevens. Dit type data wordt niet enkel verzameld in de medische wereld maar ook door de overheid en opsporingsinstanties. Zelfs de iPhone 5 verzamelt biometrische data door gebruik te maken van vingerafdruk- en/of gezichtsherkenning.

4)      Human Generated Data.

Het vierde type Big Data is data die door personen zelf (handmatig) gegenereerd is. Hierbij is vooral de metadata van belang als het om persoonsgegevens gaat. Dit is de zogenaamde data over data. Waarschijnlijk zal de eerste gedachte bij metadata zijn dat er geen sprake is van persoonsgegevens. Het is tenslotte niet de inhoud die opgeslagen wordt, enkel de kenmerken van de data. Het tegendeel is waar. Bij e-mails zal bijvoorbeeld de verzender (het gebruikte e-mailadres), de ontvanger, de datum van verzending, de taal en het aantal woorden van de e-mail worden opgeslagen als metadata. Namen en e-mailadressen zijn persoonsgegevens, deze data is namelijk herleidbaar naar een individu. Daarom is er ook bij metadata spraken van persoonsgegevens.

5)      Web en Social Media Data.

Het laatste type Big Data is waarschijnlijk de snelst groeiende dataset van de vijf typen Big Data. Dit type Big Data kan opgedeeld worden in Social Media Data en Web Data. Social Media Data betreft alle data welke op online platforms actief gegenereerd is door haar gebruikers. Deze data bevat veel verschillend persoonsgegevens. Denk bijvoorbeeld aan accountgegevens (naam, woonplaats, telefoonnummer, profielfoto), geplaatste foto’s (bijzondere persoonsgegevens) en metadata van tweets en soortgelijke berichten. Onder Web Data valt alle data welke passief gegenereerd wordt door een internetgebruiker, beter bekend als cookies. Aan de hand van tracking cookies kan een gebruikersprofiel opgesteld worden van de internetgebruiker, op basis van het zoek-, klik- en surfgedrag. Ook tracking cookies bevatten persoonsgegevens (IP-adres en accountgegevens).

Concluderend kan elk type Big Data persoonsgegevens bevatten. Uiteraard zijn er ook uitzonderingen van datasets die puur technische gegevens bevatten. Denk hierbij bijvoorbeeld aan data welke verkregen is uit het gebruik van de deeltjesversneller door CERN. In dat geval zal er niet snel sprake zijn van verwerking van persoonsgegevens. Lees volgende week in BigDatamaandag meer over het anonimiseren van datasets!