GPT-5, hype of wonderkind?

Na bijna een jaar van speculatie is daar dan eindelijk het nieuwe model van het bedrijf achter de meest gebruikte AI chatbot, GPT-5. Het internet en sociale media staan bol van deze nieuwe aankondiging, maar de grote vraag is: is dit model het wachten waard?

Wat is er nieuw?

De CEO van OpenAI, Sam Altman, stelt dat GPT-4 het domste model is dat we ooit gebruikt hebben. Dit klinkt misschien een beetje hard, maar GPT-5 zou echt een enorme stap voorwaarts zijn, vooral op het gebied van het begrijpen van complexe wetenschappelijke en technische vraagstukken. Dit biedt nieuwe mogelijkheden voor het verfijnen van onze eigen CustomGPTs bij ICTRecht, die zich specifiek richten op juridische vraagstukken.

Een van de grootste verbeteringen die OpenAI heeft doorgevoerd is het vergroten van de context. Wanneer je een gesprek hebt met ChatGPT, kan het dus eenvoudiger grote onderzoeken gebruiken bij het beantwoorden van de vraag. Dit kan leiden tot betere antwoorden. Voor onze CustomGPTs betekent dit dat we de context beter kunnen afstemmen op specifieke juridische vraagstukken, waardoor de modellen relevantere en gedetailleerdere antwoorden kunnen geven.

Daarnaast is het model getraind natuurlijker te schrijven, wat ons helpt om juridische teksten niet alleen sneller, maar ook duidelijker te genereren. Dit zal de ervaring voor onze gebruikers verder verbeteren.

Technische hoogstandjes en verbeteringen

En ander stokpaardje van dit model is de mogelijkheid tot het schrijven van code. Vraag om iets te ontwerpen en binnen enkele minuten heb je een werkende mockup. Een simpele opdracht om een feestelijke app te maken om een dobbelsteen te werpen, levert bijna 500 regels aan code op en een werkende app om die dobbelsteen te laten rollen, inclusief confetti bij het rollen.

Daarnaast claimt OpenAI dat dit model nauwkeurig is in het geven van medische antwoorden, iets waarvoor we voorlopig nog gewoon naar de huisarts moeten gaan wat mij betreft. Ten slotte is dit model getraind om eerder toe te geven wanneer het niet in staat is om taken uit te voeren. Waar in de vorige versies nog wel eens overtuigend gebracht werd dat iets uitgevoerd is terwijl dit niet het geval was, belooft OpenAI verbetering.

Details

De gepubliceerde system card[2] geeft meer informatie over de details van het model, zoals het testen en de prestaties. Hier is een onderscheid gemaakt tussen het GPT-5 thinking model en het GPT-5 main model. Een interessante verbetering betreft het verminderd hallucineren. De grafieken hieronder geven duidelijk weer dat beide varianten beter scoren dan hun voorgangers.

Factuality on ChatGPT Production traffic (Browsing Enabled)

Average Hallucination Rate (Browsing Enabled)

Ook zijn enkele verbeteringen zichtbaar vergeleken met de vorige modellen. Zo is er aandacht voor sycophancy, een te vriendelijke reactie van je AI vriend. Eerder heeft OpenAI een update van 4o teruggedraaid omdat het te vleiend en instemmend was. Bij de training van het model is bewust rekening gehouden met deze kritiek.

Het komt met stip binnen op één bij de benchmark van AI Arena. Dit is een van de meest toonaangevende benchmarks waarin gebruikers nieuwe modellen testen en beoordelen. Het nieuwe vlaggenschip van OpenAI wordt dan ook goed beoordeeld. Overigens zijn niet alle gebruikers even enthousiast over de nieuwe weg die OpenAI is ingeslagen. Zo missen gebruikers de uitgebreidere antwoorden van GPT-4o en wekt de pop-up om pauze te nemen vooral irritatie op. Sam Altman heeft op X laten weten dat het voor Pro-gebruikers mogelijk is om 4o te blijven gebruiken.

Goed om te weten: GPT-5 heeft een knowledge cutoff van 30 september 2024. Dit betekent dat er geen trainingsdata van na deze datum is gebruikt. De mogelijkheid om op het internet te zoeken kan dit kennisgat overbruggen maar dit zit dus niet standaard in de kennis van GPT-5.

Hoe zit het met de oude modellen?

AI chatbots staan niet bepaald bekend om de flitsende namen. Hier heeft OpenAI met de komst van GPT-5 helaas nog geen passend antwoord op. Wel wordt er iets van de verwarring opgelost door alle voorgaande modellen te vervangen door een nieuwe variant:

Previous model

GPT‑5 model

GPT‑4o

gpt-5-main

GPT‑4o-mini

gpt-5-main-mini

OpenAI o3

gpt-5-thinking

OpenAI o4-mini

gpt-5-thinking-mini

GPT‑4.1-nano

gpt-5-thinking-nano

OpenAI o3 Pro

gpt-5-thinking-pro

Bron van de tabel

Als gebruiker kun je dus niet meer kiezen uit diverse verschillende (en misschien wel verwarrende) modelnamen. Wanneer je een gesprek begint, dan beslist ChatGPT zelf of het basismodel voldoende is om de vraag te beantwoorden of dat er geswitcht moet worden naar het thinking model. Zoals de naam al doet vermoeden is dit model zo ontwikkeld dat het ‘nadenkt’ voordat het antwoord geeft. Het model stelt zichzelf enkele vragen voordat ze op de gebruiker reageren. Dit betekent een verfijnd proces en stelt het model in staat verschillende strategieën uit te proberen en fouten te herkennen.

Onze CustomGPTs: GPT-5 als nieuwe standaard

De afgelopen periode hebben we diverse CustomGPTs gelanceerd en een uitgebreide promptbibliotheek. Met de komst van GPT-5 wordt dit automatisch de nieuwe standaard voor onze CustomGPTs, wat betekent dat we direct profiteren van de verbeteringen die GPT-5 biedt. De komst van GPT-5 zal waarschijnlijk nog betere resultaten opleveren. Uiteraard zal dit nauwkeurig gemonitord worden en waar nodig passen we de CustomGPT’s of prompts aan. De eerste tests zijn in ieder geval veelbelovend.

Naast het gebruik van de modellen via ChatGPT, is OpenAI leverancier van het onderliggende model voor veel AI tools. Zo ook in de juridische markt. Veel gespecialiseerde AI-oplossingen voor de juridische markt maken onder andere gebruik van de API van OpenAI. De meeste van deze leveranciers omarmen het nieuwe model en geven aan dat dit de dienstverlening zal verbeteren.

Toegang

Wil je het zelf ervaren? Voor de betaalde gebruikers van ChatGPT met een Pro- of Team-account is GPT-5 nu beschikbaar. OpenAI heeft toegezegd dat ook gratis gebruikers toegang krijgen tot het nieuwe model, hoe en in welke vorm dit zal gebeuren is nog niet geheel duidelijk.

Wil je meer weten?

Tijdens ons webinar op 9 september, onderdeel van de reeks ‘Slimmer werken met AI’, behandelen we de nieuwste functionaliteiten van onze promptbibliotheek en de recente ontwikkelingen met CustomGPTs. Dit is het perfecte moment om te ontdekken hoe GPT-5 ons kan helpen om juridische processen nog efficiënter te maken. Mis het niet!

Direct aanmelden


[2] Interview met Cleo Abram op 8 augustus 

Terug naar overzicht