Self-driving cars (c) Ramin Hasani
Author profile picture

Zoekmachines maar ook zelfrijdende auto’s zijn gebaseerd op kunstmatige intelligentie. Hierachter zitten complexe neurale netwerken. Tot nu toe konden de onderliggende wiskundige modellen alleen met een enorme rekenkracht worden geïmplementeerd en waren ze voor de mens moeilijk te begrijpen. Professor Radu Grosu, hoofd van de onderzoeksgroep Cyber Physical Systems aan de TU Wien, denkt al jaren na over hoe modellen van biologische zenuwstelsels, kunstmatige netwerken beter en begrijpelijker kunnen maken.

Neurale netwerken – zoals de hersenen van levende wezens – bestaan uit vele individuele cellen. Wanneer een bepaalde taak moet worden opgelost, stuurt een actieve cel een signaal naar andere cellen. De som van de signalen die de betreffende cel ontvangen, bepaalt of deze ook actief wordt. Hoe cellen de activiteit van andere cellen op deze manier beïnvloeden, blijft in eerste instantie onduidelijk. De parameters worden in een automatisch leerproces aangepast totdat het neurale netwerk de taak kan oplossen.

Het leerproces is nauwelijks zichtbaar voor mensen en vaak onbegrijpelijk. Daarom spreken we van een zwarte doos. Om het vertrouwen in kunstmatige intelligentie te versterken, zijn systemen nodig die door de mens kunnen worden geverifieerd..

Biologisch model

Professor Grosu heeft geprobeerd dit probleem samen met onderzoekers van de Massachusetts Institute of Technology (MIT), TU Wien en het Institute of Science and Technology IST Austria op te lossen. Het biologische model werd geleverd door een wormpje dat officieel ‘Caenorhabditis Elegans’ heet. Het rondwormpje, of C.elegans in spreektaal, is een van de belangrijkste modelorganismen in de biologie. Het is klein, transparant en heeft slechts drie dagen nodig om zich te ontwikkelen. Hoewel het slechts enkele zenuwcellen heeft, vertoont het verbazingwekkend interessante gedragspatronen. Dit is te danken aan de efficiënte en harmonieuze manier waarop het zenuwstelsel informatie verwerkt, weet professor Grosu.

Basis voor neurale netwerken

“Toch lijkt in vergelijking met de structuur van diepe neurale netwerken (DNN’s) het zenuwstelsel van C. elegans op het eerste gezicht chaotisch”, aldus Mathias Lechner, promovendus in de Henzinger Groep bij IST Oostenrijk. De onderzoekers vonden de basis voor het nieuwe neurale netwerk in de functies van de neuronen.

Lechner: “Neurowetenschappers verdelen de neuronen van het systeem in de groepen Sensory, Inter en Motor. In de Inter-neuronen is er ook de subgroep Command-neuronen, waarin belangrijke signaalwegen zijn geconcentreerd. In het zenuwstelsel van C. elegans bijvoorbeeld, zijn er commando-neuronen voor voorwaarts en achterwaarts kruipen waarin de signaalwegen van de bewegingscontrole zijn geconcentreerd. Voorwaartse en achterwaartse bewegingen zijn echter zelf veel complexer en vereisen meerdere neuronen en spieren om samen te werken.”

Om de efficiëntie en harmonie van het zenuwstelsel van C. elegans te bereiken, ontwikkelde de onderzoeksgroep nieuwe wiskundige modellen voor neuronen en synapsen. De verwerking van signalen binnen de afzonderlijke cellen volgt ook andere wiskundige regels dan die van de bestaande diepliggende leermodellen. Een andere vereenvoudigende factor was dat niet elke cel met elke andere cel was verbonden.

Testscenario

Het testscenario was baanvastheid bij autonoom rijden. Hier beslist het neurale netwerk automatisch of er naar rechts of naar links wordt gestuurd op basis van een camerabeeld van de weg. In bestaande modellen voor diepgaand leren vereist deze taak miljoenen parameters.

Het nieuwe model van de onderzoeksgroep beheert echter slechts 75.000 trainbare parameters. Ter voorbereiding op de test werden grote hoeveelheden video’s van door mensen bestuurde auto’s in de omgeving van Boston verzameld. Deze werden in het netwerk ingevoerd, samen met informatie over hoe de auto in elke situatie moet worden bestuurd. Dit trainingsproces gaat door totdat het systeem het juiste verband heeft geleerd tussen het beeld en de stuurrichting, en ook zelfstandig nieuwe situaties aankan.

Slechts 19 cellen

Het model van de kunstmatige intelligentie bestaat uit twee delen. Er is een convolutioneel netwerk en een besturingssysteem. Beide subsystemen worden in eerste instantie samen getraind. Het convolutionele netwerk heeft de taak om structurele beeldkenmerken in de visuele gegevens van de camera te herkennen.

Het geeft de relevante delen van het camerabeeld in de vorm van signalen door aan het controlesysteem, dat het voertuig bestuurt. Het neurale netwerkbesturingssysteem (het zogenaamde neurale circuitbeleid, of NCP), dat de gegevens van het visuele netwerk vertaalt in een stuurcommando, bestaat uit slechts 19 cellen. Dit maakt het drie orden van grootte kleiner dan de bestaande state-of-the-art modellen.

Interpreteerbaar

Het model maakt het mogelijk om precies te onderzoeken waar het neurale netwerk zijn aandacht op richt tijdens het rijden. Het richt zich namelijk op zeer specifieke gebieden van het camerabeeld: de rand van de weg en de horizon. Dit gedrag is zeer wenselijk. Het is uniek voor op kunstmatige intelligentie gebaseerde systemen.

Volgens Lechner kan ook de rol van elke cel in elke individuele beslissing worden geïdentificeerd. De functie van de cellen is begrijpelijk en hun gedrag is verklaarbaar. Dit niveau van interpreteerbaarheid is tot nu toe onmogelijk geweest in grotere Deep Learning-modellen, aldus de onderzoeker.

Kortere trainingstijd

Een tekortkoming van bestaande diepliggende leermodellen is ook dat ze niet in staat zijn om met een slechte beeldkwaliteit om te gaan. Deskundigen noemen dit beeldruis. Deze eigenschap kan ook worden verbeterd in het nieuwe systeem. Dit bleek uit een analyse waarbij het neurale netwerk werd geconfronteerd met kunstmatig beschadigde beelden. Deze robuustheid is volgens de onderzoekers een direct gevolg van het concept en de architectuur van de innovatie. De gebruikte methoden leiden ook tot een kortere trainingstijd. Hierdoor kan kunstmatige intelligentie zelfs in relatief eenvoudige systemen worden toegepast.

Het Deep Learning-model maakt imiterend leren mogelijk in een breed scala aan toepassingen, van geautomatiseerd werken in magazijnen tot robotbewegingen. De onderzoeksresultaten zijn gepubliceerd in het vakblad Nature.

Ook interessant: ‘Dat mensen onfeilbare AI kunnen maken, is een utopie’