Zoals meer gemeenten is ook Eindhoven druk bezig om een visie op datagebruik te ontwikkelen. Dit alles mede omdat de stad zich wil ontwikkelen tot een ‘smart society’. E52 volgt de ontwikkelingen op de voet, onder meer door diverse reportages over het project “De Staat van Eindhoven” en “Datastudio Eindhoven“.
In onderstaande analyse gaat Klaas Kuitenbrouwer van Het Nieuwe Instituut in op het Eindhovense data-beleid. Daarvoor werpt hij ook een blik op de aard, de geschiedenis en de ontwikkeling van datagebruik.
Door Klaas Kuitenbrouwer
Data in de stad
In het debat over de smart city stonden de afgelopen jaren vooral de mogelijkheden van de technologie centraal. Het ging over hoe datagedreven toepassingen in staat zouden zijn om rommelige en grotendeels onvoorspelbare steden te herscheppen tot zachtglanzende wit-groene leefwerelden die blaken van gezondheid. De dromen waren groots: met big data kunnen we een aantal hardnekkige stedelijke problemen eindelijk oplossen. We kunnen het stedelijk verkeer ontstoppen; we kunnen de kringloopeconomie aanzwengelen, het gedrag van dieven en hooligans voorspellen en ze zo in de kraag vatten voor dat ze iets vervelends hebben uitgespookt. En zo zijn er nog een aantal ingewikkelde maatschappelijke issues die met behulp van data eerst transparant zouden kunnen worden gemaakt en vervolgens onder controle kunnen worden gebracht. Mensen zijn in deze varianten van de smart city vooral passieve leveranciers van data. Hun gedrag moet worden uitgelezen, vervolgens gemodelleerd en kan dan worden gecontroleerd.
Maar het debat over de smart city neemt de laatste tijd een wending. De nieuwe smart city draait meer om de behoeften van burgers en minder om de perfecte modellen. (In dit rapport van de Engelse denktank Nesta wordt deze recente ontwikkeling geschetst.) De vraag is niet meer hoe de hardware van de stad stad smart zou kunnen worden, maar hoe de stad het toneel van een slimme samenleving, een smart society kan worden. Ook hierin speelt data een centrale rol. Maar data is niet een éénvormig materiaal. Er zijn verschillende soorten data en verschillende manieren om data te verzamelen. Over wat voor data hebben we het eigenlijk? Waar komt die vandaan? Welke partijen bezitten er data in de stad en welke niet? Wie mag welke data waarvoor gebruiken, en onder welke randvoorwaarden? Is de datapolitiek van Gemeente Eindhoven voldoende toegerust om de burger de centrale plek in de smart society te laten innemen?
Ultrakorte geschiedenis van stedelijke data
Al in de Bijbel staat een beroemd verhaal over een overheid die data verzamelt. Overheden en steden waren lange tijd veruit de grootste databezitters en de ontwikkeling van steden wordt sinds jaar en dag gevolgd met behulp van data, letterlijk: gegevens. Vóór de komst van de computer werden die bijgehouden op papier en bewaard in dossiers en archieven. Burgers leverden data via hun handelingen in de maatschappij: het in- of uitschrijven bij gemeenten, het kopen en verkopen van huizen, het raadplegen van dokters en het bezoeken van ziekenhuizen, het kopen en verzekeren van auto’s en meer. Ook vonden met grote regelmaat bevolkingsonderzoeken plaats waarin een representatieve groep burgers gevraagd werd om reeksen vragen te beantwoorden. Op verschillende plekken bewaarde gegevens konden door journalisten, beleidsmatige onderzoekers, historici en andere wetenschappers worden geraadpleegd.
Vanaf de jaren ’60 van de 20ste eeuw worden geleidelijk steeds meer gegevens bewaard met behulp van computers, in databases. Die hadden als groot voordeel dat gegevens veel sneller doorzocht en geanalyseerd konden worden. Het nadeel was dat er weer een nieuw soort specialist te pas moest komen aan het doorzoeken van gegevens: de programmeur. Vanaf de jaren ’80, werden computers gekoppeld tot het internet, en konden gegevens ogenblikkelijk van de ene computer naar de andere worden verstuurd. Datasets konden zo makkelijker worden gecombineerd. Ook werden computers gebruiksvriendelijker, zodat steeds meer soorten mensen data op computers konden lezen en gebruiken. Vanaf de jaren ’90 groeide internet met ongelofelijke snelheid uit tot het wereldomspannende netwerk waarmee nu bijna de helft van de wereldbevolking online kan. Met de komst van internet zijn voor het eerst andere partijen dan overheden de grootste data-eigenaren geworden. Op dit moment bezitten Alphabet (voorheen Google) en Facebook (waarschijnlijk) de grootste data-verzamelingen ter wereld.
Alle gebruikers van internet genereren door hun computergebruik voortdurend technische maar ook persoonlijke gegevens. Via sociale media (vanaf ongeveer 2007 begon de opmars van Facebook) leveren internetgebruikers vooral zeeën aan data over henzelf. Het grootschalige gebruik van RFID vanaf 2000 en recenter de komst van het internet-of-things zorgen ervoor dat naast menselijke gebruikers een enorm aantal apparaten via sensoren gegevens genereert en online uitwisselt.
Open Data
De data die stedelijke overheden traditioneel bezitten werd voor een groot deel expliciet in bevolkingsonderzoeken verzameld, met medeweten en toestemming van burgers. Op grond van die data werden beleid ontwikkeld en werden beslissingen gelegitimeerd. Vanaf 2007 kwam eerst in de VS en later in Europese landen waaronder in sterke mate ook Nederland een beweging op gang om overheden en andere organisaties te bewegen om hun gegevens online openbaar te maken. Ten eerste zou dat de democratie dienen: als iedereen de gegevens zou kunnen inzien op basis waarvan beleid wordt gemaakt, kan er meer geïnformeerd gediscussieerd een meebeslist worden. Bovendien kunnen overheden zo geen feiten naar hun hand zetten – was de gedachte. Ten tweede zouden burgers die toegang hadden tot de overheidsdata daarmee zelf in staat zijn om problemen te signaleren of toepassingen te verzinnen. Toegang tot open data gaf een nieuwe praktische dimensie aan burgerschap.
De open data beweging is zonder meer succesvol geweest, Het is tegenwoordig gangbare praktijk voor stedelijke en andere overheden om hun data beschikbaar te maken. Dit soort open data is gestructureerd, zodat het mogelijk is om directe, harde koppelingen te maken tussen bijvoorbeeld huizenprijzen in een bepaalde buurt, afkomstig uit één database, en financiële gegevens over dezelfde buurt uit een andere database.
Open gestructureerde overheidsdata wordt gepubliceerd in de buurtmonitor. Het bevordert de transparantie van bestuur en kan beslissingen legitimeren, of juist helpen als partijen ter verantwoording moeten worden geroepen. Ook kan deze data meewerken bij het zetten of beînvloeden van publieke agenda’s. De data voor de buurtmonitor wordt in jaarlijkse steeksproeven verzameld en wordt geaggregeerd op het schaalniveau Postcode 4 – dat wil zeggen in eenheden die corresponderen met de getallen uit de postcode. In de buurtmonitor kun je als gebruiker niet dieper inzoomen dan tot op de schaal van het huizenblok. Gemeenten zijn op zich geïnteresseerd in meer gedetailleerde gegevens over ontwikkelingen, zowel in ruimtelijke zin als qua tijd: dat wil zeggen: vakere updates
In Almere draait het pilotproject Straatkubus, waarin de gemeente haar open data aanbiedt op het aggegatieniveau Postcode 6 – dat wil zeggen op het niveau van de postcode inclusief de letters, dus op de schaal van de individuele straat.
Maar op die schaal begint de persoonlijke levenssfeer van individuele burgers in beeld te komen, die door Artikel 10 van de Grondwet wordt beschermd. De overheid heeft weliswaar enkele rechten met betrekking tot de inmenging in de persoonlijke levenssfeer, (zoals geregeld met de Wet op Bescherming van Persoonsgegevens. ) maar de Straatkubus is ongeveer zover als een Gemeente kan gaan bij het verzamelen en beschikbaar stellen van haar data.
Wat in het kader van het publiceren van overheidsdata altijd een beetje is tegengevallen, is dat er niet echt echt killer-apps mee zijn gemaakt ondanks de nodige progammeerworkshops (“hackatons”) die er aan zijn gewijd. Een reden daarvoor lijkt te zijn dat de overheidsdata speciaal is geconstrueerd en geformatteerd om onderbouwing van beleid mogelijk te maken, en dat behoeften die burgers zouden hebben, niet echt met dit soort data kunnen worden ingevuld.
Big Data
Al sinds 1941 wordt er gesproken over de ‘informatie explosie’ en de term big data circuleert al vanaf 1998, (zie dit artikel in Forbes) al was de hoeveelheid die toen ‘big’ genoemd werd, microscopisch vergeleken met wat er dezer dagen aan data wordt gegenereerd. Wat we nu met ‘big data’ bedoelen, is vooral ontstaan in het kielzog van web 2.0. Het is het onafzienbare stuwmeer aan gegevens dat wordt geproduceerd door het online optreden van miljoenen mensen en apparaten. Het zijn de digitale sporen van menselijke en machinale gebruikers van google, twitter, facebook, instagram en andere platforms. Het is data die wordt geproduceerd door cctv camera’s, verkeerssensoren, luchtkwaliteitmeters, weerstations, smart phones, auto’s, et cetera.
Big data is niet gestructureerd en wordt niet officieel door iets of iemand ‘gepubliceerd’. Big data is over het algemeen bezit van private bedrijven die de hard- of software maken waarin de data wordt gegenereerd. Big data staat niet overzichteljk in publiek toegankeijke databases, maar is alleen met speciale technische kennis vindbaar en zichtbaar te maken. De waarde van big data zit niet zozeer in de ‘content’ van het afzonderlijke datapunt, zoals bij de open data van overheden; maar zit in de betekenisvolle patronen die erin te vinden zijn door het correleren van gigantische hoeveelheden meetpunten met behulp van geavanceerde algoritmen. Het is vooral de golf aan big data die aanleiding heeft gegeven tot de fantasieën over de smart city.
De beloften van big data zijn interessant voor mensen die zich vanuit een beoefte aan efficientie en beheersbaarheid met de ontwikkeling van steden bezighouden. Big data biedt inzicht in stedelijke processen op een nieuw en ongelofelijk rijk niveau van detail. Maar vanuit de nieuwe aandacht voor de centrale plek van de burger in de stad, kleven er de nodige issues aan de inzet van big data.
Issues
Ten eerste kan de gemiddelde burger big data niet lezen. De klassieke beleidsdata die open wordt gepubliceerd is al lastig om te interpreteren, ondanks de moeite die er wordt gedaan om die zo goed mogelijk toegankelijk te maken. Het lezen van big data vraagt hoe dan ook om geavanceerde programmeerkennis. Er zijn uiteraard burgers met dergelijke kennis, en waarschijnlijk heeft Eindhoven met haar geschiedenis in technologie er iets meer dan gemiddeld, maar hun aantal blijft zeer beperkt. Dit heeft het paradoxale gevolg dat individuen (met name voor bedrijven) steeds zichtbaarder worden in de almaar rijker wordende datastromen, maar dat ze voor zichzelf in de data steeds onzichtbaarder worden.
Overigens zijn ook de statistici van de overheid lang niet allemaal ervaren in de omgang met big data, opgegroeid als ze zijn in de werkelijkheid van de klassieke beleidsdata.
Ten tweede geldt hier opnieuw dat de redenen voor het genereren en correleleren van data niet per se voortkomen uit de behoeften en vragen van burgers. De vraag is niet alleen: welke data kunnen en mogen burgers gebruiken, de meer fundamentele kwestie is: hoe krijgen burgers medezeggenschap over de systemen waarmee data worden verzameld?
Dat raakt aan een derde onoverzichtelijke issue in verband met big data: die van eigenaarschap. De klassieke open data was van de overheid, en daarmee letterlijk ook van de burger die door de overheid wordt vertegenwoordigd. Big data wordt met name gegenereerd door bedrijven en is veel geld waard.
Over persoonsgegevens(naam, adres, woonplaats) zijn er weliswaar wettelijke regels, maar ook waar er formeel geen persoonsgegevens in het spel zijn kan de persoonlijke levenssfeer scherp in beeld worden gebracht: denk aan online gebruiksgeschiedenis en koopgedrag, of aan de locatie van de mobiele telefoon. De huidige regels gaan er de facto van uit dat individuen zelf verantwoordelijk zijn voor de handhaving van hun rechten over hun gegevens, maar het is duidelijk dat burgers nauwelijks inzicht hebben in wie de gegevens allemaal verwerken, hoe ze worden beoordeeld en getypeerd, en wat daar de gevolgen van zijn.
Daarmee komt de onderliggende moeilijkheid in beeld: de huidige juridische uitgangspunten voor de omgang met data zijn niet meer toereikend voor de technische werkelijkheid van big data. De Nederlandse Juristen Vereniging (NJV) heeft in haar pre-advies voor kwesties die in 2016 zullen spelen de wetgeving voor de digitale sfeer onder de loep genomen. Ze komen tot de volgende overweging. De huidige wet op bescherming van persoonsgegevens werkt met de doelen voor gegevensverwerking en sommige doelen zijn legitiem en andere niet. Bescherming van de gezondheid is bijvoorbeeld een legitiem doel. Maar de wet zegt niets over het belang dat partijen kunnen hebben bij gegevensverwerking – en daar zit het zwakke punt. Een commerciële partij die een app bouwt waarmee gebruikers hun kans op besmetting met griep in beeld kunnen krijgen is even legitiem voor de wet als de Wereld Gezondheids Organisatie, ook als de commerciële partij hun verzamelde data doorverkoopt aan verzekeringsmaatschappijen. De NJV stelt dat het voor het organiseren van zeggenschap over data belangrijk is dat de wet meer aandacht besteed aan het belang dat betrokken partijen hebben bij gegevens verwerking dan aan het formele doel dat ze ermee dienen.
De datapolitiek van Eindhoven
De Gemeente Eindhoven heeft de ambitie om vorm te geven aan de smart society en is zich sterk bewust van de gevoeligheden rondom de omgang met data en persoonsgegevens. Ze heeft daarom in september 2015 een 8-regelige datacode opgesteld om kaders te geven voor dataverwerking in de openbare ruimte. Dat is is in principe een voorbeeld dat navolging verdient. De Gemeente Eindhoven trekt hiermee initiatief en enige zeggenschap over de inrichting van de slimme samenleving naar zich toe. Met het bovenstaande in het achterhoofd is echter wel echter vrij snel te zien dat een aantal kwesties met deze code niet worden opgelost.
Lees hier de complete datacode
Regel 1 “Data in de openbare ruimte zijn van eenieder. Deze data zijn publiek goed. Data die worden verzameld, gegenereerd of opgemeten (bijvoorbeeld door sensoren die in de stad zijn geplaatst), moeten worden opengesteld, zodat iedereen daarvan gebruik kan maken voor commerciële en niet-commerciële doelen” en Regel 4:” Data die geen persoonsgegevens (meer) bevatten, dienen zodanig te worden geplaatst dat eenieder op een gelijkwaardige wijze toegang heeft tot die data (bijvoorbeeld via een Open Data portaal). Er worden geen technische of juridische belemmeringen opgeworpen die toegang tot data beperken” geven samen in ieder geval de condities voor open toegankelijkheid van verzamelde data, en daarmee de mogelijkheid van democratische controle op de omgang met de data. Een andere voorwaarde is natuurlijk nog wel dat burgers hoe dan ook over de nodige technische capaciteiten moeten beschikken om deze nieuwe open data ook echt te kunnen lezen.
Regel 2 stelt: “Data kunnen persoonsgegevens bevatten. Deze data kunnen dus de levenssfeer van personen raken. De regels van de Wet Bescherming Persoonsgegevens zijn hierop van toepassing. Deze data mogen pas worden opengesteld na anonimisering.”
Dat betekent formeel dat naam, adres en woonplaats van burgers niet meer in de gegevens mogen voorkomen. Maar met big data is de individuele levenssfeer ook zonder die gegevens zeer precies in beeld te krijgen. De vraag is dus: hoever gaat de anonimisering? Worden bijvoorbeeld ook IP adressen verwijderd?
Regel 3 zegt: “Data die wel privacy- of veiligheidsrisico’s meebrengen mogen uitsluitend worden verwerkt binnen de kaders van de privacywetgeving. Opslag en verwerking van data dienen volgens bestaande wetgeving uitgevoerd te worden.” In feite staat hier alleen dat de wet van toepassing is – een mogelijk geruststellende, maar ook enigszins overbodige mededeling. De NJV stelt echter dat de wet eigenlijk niet meer toereikend is. Dat is de Gemeente Eindhoven niet aan te rekenen, maar betekent wel dat deze code ook niet echt volstaat als richtlijn voor de omgang met data uit de openbare ruimte.
Regel 8 zegt tot slot: “De gemeente blijft in dialoog met de partijen die bijdragen aan de data-infrastructuur in de stad en streeft ernaar verdienmogelijkheden en een vruchtbaar economisch klimaat te creëren.”
Dit uitgangspunt lijkt te zijn opgenomen om private partijen die een rol (kunnen) spelen in de data-infrastructuur niet te veel af te schrikken. Het suggereert ook – terecht – dat er nog het nodige is af te wegen als het gaat om de balans tussen publieke en private agenda’s in verband met de data-infrastructuur in de stad.