Home / Nieuws & Blogs / Wet hergebruik: een machinaal leesbaar formaat

Wet hergebruik: een machinaal leesbaar formaat

| 22 februari 2016

Sinds juli 2015 is de Wet Hergebruik Overheidsinformatie in werking getreden. Vrijwel alle overheidsorganisaties zijn vanaf dat moment verplicht om overheidsinformatie tegen marginale kosten beschikbaar te stellen voor hergebruik door burgers of bedrijven. Omdat hergebruik vereist dat informatie zonder technische of juridische beperkingen gebruikt kan worden, bevat de wet een aantal randvoorwaarden waar de overheid aan moet voldoen.
Een belangrijke voorwaarde is dat de informatie beschikbaar moet worden gesteld in een machinaal leesbaar open formaat, samen met de metagegevens, in een vorm die interoperabiliteit mogelijk maakt.

Zo’n voorwaarde is natuurlijk vragen om moeilijkheden: want wat als informatie al openbaar toegankelijk is, bijvoorbeeld omdat een met informatie gevulde "databank" al via een internet website van de overheidsorganisatie raadpleegbaar is. Kun je dan stellen dat, omdat de informatie leesbaar is door middel van een webbrowser en een computer, en je de content handmatig of door middel van een scraper zou kunnen kopiëren, hiermee voldaan is aan deze voorwaarde?

Een document wordt als document in machinaal leesbaar formaat beschouwd als het een bestandsformaat heeft met een zodanige structuur dat softwaretoepassingen gemakkelijk specifieke gegevens in het document kunnen identificeren, herkennen en extraheren. Documenten die zijn gecodeerd in een bestandsformaat dat een automatische verwerking beperkt doordat de gegevens niet of niet gemakkelijk uit de documenten kunnen worden gehaald, mogen volgens de Europese richtlijn niet als documenten in een machinaal leesbaar formaat worden beschouwd. Dat bestandsformaat dient tevens platformonafhankelijk te zijn en voor het publiek beschikbaar zonder enige beperking die het hergebruik van informatie verhindert.

Voor informatie in spreadsheets zouden daarom de bestandsformaten CSV, ods of XML bruikbaar zijn, terwijl voor tekstinformatie eerder gedacht kan worden aan TXT, ODT, bepaalde pdf versies (mits opgeslagen met de juiste toegankelijkheidinstellingen) en ook html. Het probleem is uiteraard dat veel informatie op dit moment is opgeslagen in bestandsformaten op een wijze die vooral geschikt is voor mensen, en minder voor geautomatiseerde verwerking. Dus hoewel een webpagina in html in bepaalde omstandigheden voldoet aan de voorwaarde uit de Wet Hergebruik Overheidsinformatie, zal het doel van de wet pas echt goed bereikt kunnen worden indien ook de achterliggende ruwe bronbestanden voor hergebruik beschikbaar worden gesteld.