Het Artificial Intelligence (AI) onderzoekslab OpenAI heeft begin deze week GPT-4 vrijgegeven, de nieuwste versie van zijn baanbrekende AI-systeem. De makers zeggen dat het complexe problemen nauwkeuriger kan oplossen en creatiever kan zijn.
OpenAI’s medeoprichter Sam Altman omschrijft GPT-4 als een ‘multimodaal’ model, wat betekent dat het tekst- en beeldinvoer kan accepteren. Gebruikers kunnen interactief vragen stellen over afbeeldingen. GPT-4 kan grotere tekstinputs aan en verwerkt in één keer 25.000 woorden – acht keer meer dan zijn vorige versie.
Het nieuwe model is nu beschikbaar voor de gebruikers van ChatGPT Plus, de betaalde versie van de ChatGPT-chatbot. Ontwikkelaars kunnen zich aanmelden op een wachtlijst om toegang te krijgen tot de API (application programming interface), waarmee twee computerprogramma’s met elkaar kunnen communiceren. Microsoft heeft fors geïnvesteerd in OpenAI en heeft inmiddels bevestigd dat Bing Chat al draait op GPT-4.
Verder werkte het bedrijf samen met partners om GPT-4-gestuurde diensten aan te bieden, zoals Duolingo Max. Deze nieuwe tier van de taalleer-app gebruikt het nieuwste model van OpenAI om met gebruikers te chatten en de gemaakte fouten uit te leggen.
OpenAI is een Amerikaans AI-onderzoeks- en ontwikkelingsbedrijf dat mensvriendelijke kunstmatige intelligentiesystemen wil creëren en promoten. Techgigant Microsoft steunt OpenAI.
ChatGPT – Generative Pretrained Transformed – is OpenAI’s AI-ondersteunde chatbot. Gelanceerd in november 2022, gebruikt het GPT-3 en -4 modellen, waarmee het kan reageren op tekstgebaseerde vragen en antwoorden in natuurlijke taal kan genereren.
GPT-4 is de nieuwste versie van OpenAI’s AI systeem. Het accepteert afbeeldingen en tekst als invoer, waardoor het creatievere outputs genereert en minder snel feiten verzint.
GPT-4 begrijpt afbeeldingen
Het belangrijkste verschil met de vorige versies is de mogelijkheid om beeldinvoer te zien en te begrijpen. Tijdens de presentatie van GPT-4 liet OpenAI’s president Greg Brockman de mogelijkheden van het systeem zien om met beelden te werken. Deze omvatten het analyseren van en reageren op afbeeldingen naast tekstaanwijzingen en het uitvoeren van taken op basis van die afbeeldingen.
Tijdens de demo werd GPT-4 gevraagd uit te leggen waarom een afbeelding van een eekhoorn met een camera grappig was. Het systeem antwoordde: “Omdat we niet verwachten dat ze zich als mens gedragen.” In een andere test voerde Brockman een handgetekende schets van een website in, en de AI kon op basis van die tekening een functionele website maken.
De GPT-4 beeldherkenningsmogelijkheden zijn nog niet volledig openbaar. Ze worden getest door Be My Eyes, een app die visueel gehandicapten gebruiken om te beschrijven wat hun telefoon ziet.
Verbeterde creativiteit en redenering
OpenAI stelt dat zijn nieuwste model “creatiever en collaboratiever is dan ooit”. Het systeem kan samen met gebruikers creatieve en technische taken genereren en bewerken. Het kan een lied componeren, een scenario schrijven of de schrijfstijl van een gebruiker leren. Bovendien, terwijl er uiterlijk bijna geen verschillen zijn tussen GPT-3.5 en GPT-4 in een gewone conversatie, kan de nieuwste versie veel genuanceerdere instructies aan.
Dit verbeterde vermogen om complexere oplossingen op te lossen is aangetoond in academische tests. In een simulatie van het bar-examen dat Amerikaanse afgestudeerden van een rechtenstudie moeten afleggen voordat zij hun beroep kunnen uitoefenen, scoorde GPT-4 bij de beste 10 procent van de deelnemers aan de test. De oudere versie – GPT-3.5 – scoorde rond de onderste 10 procent, aldus OpenAI.
GPT-4 overtreft ChatGPT in redeneervermogen. In een demo op de website laat OpenAI zien hoe het nieuwe model een afspraak van 30 minuten kan vinden op basis van de agenda’s van drie mensen. Het bedrijf zei ook dat GPT-4 meertaliger is, omdat het met grote nauwkeurigheid vragen in 26 talen (waaronder het Nederlands) beantwoordt.
Zwakke punten corrigeren
Volgens OpenAI verbetert GPT-4 veel van de zwakke punten van de vorige systeemversie. Ontwikkelaars trainden het model op gegevens die van het internet werden gehaald en GPT-4 gebruikt die om te reageren op input van de gebruiker. Als het model echter niet het juiste antwoord vindt, verzint het feiten en informatie – het hallucinatieprobleem. Bovendien kan het systeem beledigende of verontrustende antwoorden geven als het de verkeerde aanwijzingen krijgt.
Volgens OpenAI is het dankzij de gesprekken van gebruikers met ChatGPT dat deze gebreken konden worden verbeterd met GPT-4 – maar nog steeds is het systeem niet foutloos. Het bedrijf zei dat GPT-4 29 procent vaker gevoelig reageerde op medisch en zelfbeschadigend advies, terwijl het 82 procent minder vaak ten onrechte reageerde op afgekeurde inhoud.
Niettemin waarschuwt OpenAI dat GPT-4 nog steeds feiten verzint, en dringt er bij gebruikers op aan voorzichtig te zijn. Volgens de AI-startup scoort GPT-4 40 procent hoger in hallucinatietests.
Continue ontwikkeling
OpenAI zegt dat het heeft gewerkt – en zal blijven werken – aan AI-veiligheid en -beveiliging, waarbij de lessen die zijn geleerd van ChatGPT worden geïntegreerd om veiligheidsonderzoek en -bewaking te stimuleren. Meer updates en verbeteringen zullen komen naarmate meer mensen GPT-4 gaan gebruiken.
In de uitgelichte afbeelding: Midjourney’s voorstelling van GPT-4