Advertentie

OpenAI lanceert menselijkere chatbot, maar antwoord kan 1.000 euro kosten

OpenAI streeft ernaar zijn modellen beter af te stemmen op menselijke normen en waarden, en racisme en discriminatie weg te werken. ©REUTERS

OpenAI, het bedrijf achter de slimme chatbot ChatGPT, introduceert vernieuwde AI-modellen die in staat zijn complexe problemen op te lossen. Daarbij staat menselijk redeneren en reflecteren centraal, al gaat dat gepaard met aanzienlijke kosten.

OpenAI heeft vrijdag de verbeterde versie van zijn redenerende chatbot o1 voorgesteld. Het o3-model besteedt meer tijd aan het genereren van een antwoord en is daarom in staat complexere problemen op te lossen. Het model reflecteert bij elke stap, zoals een mens dat ook zou doen. OpenAI introduceerde ook een kleinere en goedkopere versie van het model, o3-mini. Volgens een woordvoerder noemde OpenAI het nieuwe model niet o2 'uit respect' voor een Brits telecommunicatiemerk dat dezelfde naam draagt.

Wie het recentste van twaalf opeenvolgende livestreamevenementen van OpenAI bijwoonde, kon hoofdonderzoeker Mark Chen zien uitleggen hoe het nieuwe AI-model o3 op verschillende vlakken aanzienlijk beter presteert dan zijn voorganger o1. Hoe complexer de vragen, hoe beter de prestaties.

Advertentie
De essentie
  • OpenAI heeft o3-modellen gelanceerd die complexere problemen kunnen oplossen dankzij meer reflectie en meer redenerend vermogen.
  • De modellen presteren beter dan hun voorgangers op het vlak van wiskunde, codering en wetenschappelijke tests, maar vereisen een aanzienlijke rekenkracht, wat weegt op de kosten.
  • OpenAI wil dat de technologie menselijke normen en waarden beter weerspiegelt.
96,7%
olympiade
Het model o3 behaalde een score van 96,7 procent op de Amerikaanse Wiskunde Olympiade.

Redeneren, coderen en wiskundige vraagstukken oplossen behoren tot de specialiteiten van o3. Op de Amerikaanse Wiskunde Olympiade (AIME) van dit jaar behaalde o3 een bijna perfecte score van 96,7 procent. Ook als 'wetenschappelijke PhD-student' blinkt o3 uit met een score van 87,7 procent in de GPQA Diamond, een toets die vragen over biologie, natuurkunde en scheikunde omvat. Bovendien overtreft o3 zijn voorganger o1 aanzienlijk in coderingsvaardigheden. Nochtans introduceerde het door Microsoft gesteunde bedrijf de modellen o1 en o1-mini pas in september.

Antwoord van 1.000 dollar

De prestaties van de o3-modellen hangen sterk af van de rekenkracht - en dus van hoeveel je ervoor betaalt. Het beantwoorden van een vraag met het meest geavanceerde o3-model kan volgens het platform ArcPrize meer dan 1.000 dollar (960 euro) kosten, terwijl de standaardversie tussen 10 en 100 dollar per taak zit. Voor versie o1 kost een vraag beantwoorden ongeveer 1 dollar.

Advertentie
TIP

Alles om u en uw onderneming te laten groeien, leest u in de WAW!-nieuwsbrief

Een wekelijkse dosis inspiratie voor ondernemers

Wekelijks via e-mail - Uitschrijven in één klik

Op volle capaciteit behaalt het model 87,5 procent op de ARC-AGI-benchmark, een test die wordt beschouwd als de standaard voor het evalueren van algemene intelligentie in AI. Dat is niet alleen een enorme sprong voorwaarts ten opzichte van zijn voorganger o1 (32%), maar ook een score die zelfs de menselijke score van 85 procent overtreft. Bij het gebruik van standaardrekenkracht zakt de score evenwel naar 75,7 procent.

Advertentie

Subjectieve kenmerken

OpenAI streeft er tegelijk naar het systeem meer menselijke normen en waarden eigen te maken en racisme en discriminatie weg te werken. 'Dat is niet simpel, omdat de mens geen rationeel wezen is en subjectieve kenmerken heeft', zegt Jorge De Corte, de oprichter van het Belgische AI-bedrijf ReBatch. 'Toch probeert OpenAI het menselijk denken en handelen zo nauwkeurig mogelijk na te bootsen.'

OpenAI probeert het menselijke denken en handelen zo nauwkeurig mogelijk na te bootsen.

Jorge De Corte
Oprichter Belgisch AI-bedrijf ReBatch

OpenAI, dat in San Francisco gevestigd is, kondigde de afgelopen twee weken in livestreams nog andere nieuwigheden aan. Tijdens het evenement '12 Days of OpenAI' maakte het technologiebedrijf de zoekfunctie ChatGPT Search beschikbaar voor elke ingelogde gebruiker, lanceerde het duurdere nieuwe ChatGPT Pro-abonnementsopties en demonstreerde het de AI-videogeneratietool Sora.

De o3-modellen zijn sinds vrijdag beschikbaar voor testen en onderzoeksdoeleinden. Begin volgend jaar zou OpenAI de o3-modellen uitbrengen voor een breder publiek.

Advertentie

In het nieuws

Alle artikels meer
Vlaams minister van Energie Melissa Depraetere (Vooruit) is blij met het succes van de premie. 'Er is in het budget voorzien.'
'Koelkastpremie' vier keer zo populair als verwacht
Naar verwachting 72.000 gezinnen zullen dit jaar gebruikmaken van de felbesproken premie voor energiezuinige huishoudtoestellen, blijkt uit een nieuwe raming die De Tijd kon inkijken. Dat is ruim vier keer meer dan gebudgetteerd. Ondertussen wil de Vlaamse Nutsregulator de premie tijdelijk stopzetten.
Gesponsorde inhoud