Een AI-model dat is getraind op slechts 61 uur uit het leven van een kind is erin geslaagd een fundamenteel taalelement te begrijpen: het verbinden van woorden met de objecten die daarbij horen. Een baanbrekend onderzoek, geleid door de Universiteit van New York en gepubliceerd op Science Today, maakte gebruik van beelden van een hoofdcamera van een peuter om de AI met 600.000 videoframes en 37.500 gesproken zinnen te voeden.
Het vermogen van het kind om taal te leren met beperkte gegevens overtreft de huidige grote taalmodellen en onthult een potentieel pad naar efficiënter en menselijker AI-leren. Het project wil kunstmatige intelligentie dichter bij de menselijke cognitie brengen en het huidige gebrek aan gezond verstand van AI aanpakken.
Waarom je dit moet lezen
Hoewel krachtig, mist de huidige generatie AI-systemen vaak de flexibiliteit en het gezond verstand dat mensen van nature hebben. De ondersteuning van de frisse blik van een kind kan helpen om de capaciteiten van AI te verbeteren.
Terwijl de wereld worstelt met de fijne kneepjes van kunstmatige intelligentie, duikt een nieuwe grens in machinaal leren op vanuit een onverwachte bron: het perspectief van een kind. Het nieuwste onderzoek van de New York University gaat in op de essentie van het leren van taal door de wereld letterlijk door de ogen van een kind te bekijken. Het onderzoek, waarbij een neuraal netwerkmodel betrokken was, heeft overtuigend bewijs opgeleverd dat AI taal kan verwerven op een manier die lijkt op die van menselijke kinderen. Deze ontdekking zou een revolutie teweeg kunnen brengen in ons begrip van zowel cognitieve ontwikkeling als AI.
Van observaties bij kinderen naar AI-leren
Om de data te verzamelen rustten wetenschappers een Australisch kind, simpelweg bekend als Sam, uit met een hoofdcamera en legden zijn dagelijkse ervaringen vast vanaf de leeftijd van zes maanden tot twee jaar. Dit visuele dagboek omvatte 61 uur aan beelden, die slechts 1% van Sam’s wakkere uren bestreken. Toch stelde deze schijnbaar onbeduidende blik in de wereld van een kind de AI in staat om aanzienlijke vooruitgang te boeken op het gebied van woordherkenning.
Door de videoframes te koppelen aan de gesproken zinnen uit Sams omgeving, verzamelden de onderzoekers een dataset van 600.000 frames en 37.500 gesproken zinnen. Deze gegevens werden het oefenterrein voor de AI, die niet was voorgeprogrammeerd met enige voorkennis van taal. De AI was volledig afhankelijk van het associatief leren van woorden en objecten zoals die samen voorkwamen in Sams gezichtsveld.
AI’s leersprong
Het leerproces van de AI was niet simpelweg een kwestie van uit het hoofd leren. Het maakte gebruik van een techniek die bekend staat als contrastief leren, waarbij patronen worden herkend op basis van de frequentie en context waarin woorden en objecten samen voorkomen. Deze benadering bootst het natuurlijke leerproces van kinderen na, die vaak hun moedertaal leren spreken en begrijpen zonder expliciete instructie, maar eerder door onderdompeling en interactie in hun omgeving.
Interessant is dat het AI-model liet zien dat het in staat is om de geleerde kennis te generaliseren. Bij een keuze tussen meerdere afbeeldingen kon de AI de afbeelding die overeenkwam met een doelwoord correct identificeren. Het model toonde een succespercentage van 62% in objectherkenning, een percentage dat aanzienlijk hoger lag dan het toevalspercentage van 25% en vergelijkbaar was met uitgebreidere AI-modellen die getraind waren op enorme datasets die veel verder gingen dan wat Sams ervaring opleverde.
Traditionele theorieën uitdagen
Dit onderzoek laat niet alleen het potentieel zien voor AI om op een meer menselijke manier te leren, maar daagt ook lang gekoesterde opvattingen in de cognitiewetenschap uit. De heersende opvatting dat taalverwerving gespecialiseerde mechanismen of aangeboren kennis vereist, wordt op de proef gesteld, aangezien de prestaties van de AI suggereren dat blootstelling aan natuurlijke menselijke omgevingen voldoende zou kunnen zijn voor het leren van de kernaspecten van taal.
Bovendien heeft het onderzoek bredere implicaties voor het gebied van AI. Hoewel krachtig, mist de huidige generatie AI-systemen vaak de flexibiliteit en het gezond verstand dat mensen van nature hebben. AI zou deze beperkingen kunnen overwinnen door leerstrategieën over te nemen die bij kinderen zijn waargenomen, wat zou leiden tot robuustere en beter aanpasbare toepassingen.
Frisse blik
De betekenis van dit onderzoek reikt verder dan de laboratoria. De mogelijkheden zijn legio, van het verbeteren van onderwijstechnologie tot het versterken van natuurlijke taalverwerkingssystemen. De onthullingen van het onderzoek over taalverwerving zijn ook een mijlpaal voor toekomstig cognitief wetenschappelijk onderzoek.
Het ogenschijnlijk eenvoudige vastleggen van de wereld door de ogen van een kind heeft een sprong voorwaarts mogelijk gemaakt in de ontwikkeling van AI. Het laat de transformerende kracht zien van het bekijken van de wereld met een frisse blik.