De hoeveelheid datasets en berekeningen die nodig zijn om Machine Learning-algoritmen te trainen, zorgen voor een enorme werklast voor cloud-servers. Daarmee gaat de CO2-voetafdruk aanzienlijk omhoog. Het Europese project SustainML wil AI-ontwerpers helpen het energieverbruik van hun toepassingen te verminderen, aldus het Franse onderzoeksinstituut Inria in een persbericht.
Volgens een studie gepubliceerd in het tijdschrift Nature stoot een alledaags trainingsmodel voor taalverwerking zo’n 300.000 kg CO2 uit, het equivalent van 125 retourvluchten tussen New York en Peking. Vijf jaar later omarmen alle sectoren van de samenleving AI en neural networks, en dat heeft impact op de aarde.
De belangrijkste doelstelling van het Europese project SustainML is om een kader te creëren dat het voor AI-ontwerpers gemakkelijker maakt om bij de ontwikkeling van hun Machine Learning-toepassingen rekening te houden met het energieverbruik. Janin Koch, wetenschapper van het Ex-Situ project-team van het Inria Saclay Centre, richt zich op de vraag hoe Human-Computer Interaction (HCI) kan worden ingezet om AI-ontwerpers te helpen duurzamere beslissingen te nemen en om hen bewust te maken van de kosten-batenafweging achter elk van deze keuzes. Het project ging in oktober 2022 van start. Naast Inria zijn vele andere partijen betrokken.
Kwantificering van de CO2-impact
Het project omvat verschillende onderzoeksgebieden. Zoals de kwantificering van de milieu-impact van algoritmen en de gevolgen van elke beslissing die tijdens de ML-levenscyclus wordt genomen. Zo zal er een groot verschil zijn in CO2-uitstoot tussen een ML-model die gebruik maakt van een cloud en hernieuwbare waterkracht, in tegenstelling tot een datacenter dat wordt aangedreven door een kolencentrale.
Maar, “het is een veel breder probleem dan alleen het kiezen van een schone cloud”, aldus Janin Koch. “De AI-gemeenschap zegt vaak: hoe meer gegevens, hoe complexer het model, hoe beter de resultaten. Wat tot op zekere hoogte niet ongegrond is, vooral als het gaat om complexe problemen. Veel toepassingen vereisen echter niet per se dit niveau van nauwkeurigheid of een enorme hoeveelheid gegevens.” Dus voordat we zelfs maar aan een AI-project beginnen, moeten wetenschappers zich afvragen: Wat heb ik echt nodig?”
Zijn er duurzamere modellen die minder gegevens nodig hebben of minder looptijd vergen? Kan ik, in plaats van een grote hoeveelheid gegevens te verzamelen, niet gewoon bestaande datasets hergebruiken? Moet ik een model vanaf nul creëren en trainen, of kan ik een model hergebruiken dat al beschikbaar is? Is het echt nodig om mijn model lang te laten draaien? “Uiteindelijk gaat het niet alleen om het verbeteren van een algoritme, maar ook om het verbeteren van de hele levenscyclus van de toepassing.”
Mensgericht interactief kader
Het project wil niet alleen het bewustzijn over duurzaamheidsafwegingen vergroten, maar ook een interactieve tool creëren om ontwikkelaars te helpen duurzamere beslissingen te nemen in elke fase van het ontwikkelingsproces. En dit is waar de bijdrage van Koch om de hoek komt kijken. “Mijn onderzoeksgebied is mens-computer interactie. Ik ben geïnteresseerd in hoe mensen en systemen kunnen samenwerken om nieuwe ideeën te verkennen. HCI omvat zowel hoe gebruikers hun doelen kenbaar maken aan een systeem, als hoe systemen suggesties doen en deze ook uitleggen.”
“In de context van dit project betekent dit: Wat weten ontwikkelaars voordat ze aan een project beginnen, en hoe zouden ze het algemene doel aan een systeem kunnen beschrijven? Dit kan soms nogal vaag zijn. Daarom bekijken we hoe systemen kunnen helpen om te bepalen wat nodig is om een doel te bereiken en welke benaderingen daarvoor geschikt zijn.”
Wil zo’n hulpmiddel werken, dan moet het de gebruiker kunnen uitleggen hoe een beslissing tot stand komt, hoe een conclusie wordt getrokken, hoe een beperking wordt afgedwongen. “Dit proces is een hele uitdaging. Als een algoritme beweert dat een bepaalde beslissing 80 procent beter is, wat betekent dat dan voor de gebruiker? Mensen begrijpen dit niet”. In plaats daarvan stelt ze voor om de verklaringen van het systeem te contextualiseren binnen het project en het proces van de gebruiker, om deze verklaringen betekenisvoller te maken.
Het SustainML-project zal naar verwachting een belangrijke impact hebben op de zogenaamde “democratisering van groene AI”, waardoor niet alleen technologiereuzen, maar ook kleine en middelgrote ondernemingen, particuliere enthousiastelingen, NGO’s en individuen op een duurzamere manier AI kunnen ontwikkelen.