OpenAI lanceert menselijkere chatbot, maar antwoord kan 1.000 euro kosten
OpenAI, het bedrijf achter de slimme chatbot ChatGPT, introduceert vernieuwde AI-modellen die in staat zijn complexe problemen op te lossen. Daarbij staat menselijk redeneren en reflecteren centraal, al gaat dat gepaard met aanzienlijke kosten.
OpenAI heeft vrijdag de verbeterde versie van zijn redenerende chatbot o1 voorgesteld. Het o3-model besteedt meer tijd aan het genereren van een antwoord en is daarom in staat complexere problemen op te lossen. Het model reflecteert bij elke stap, zoals een mens dat ook zou doen. OpenAI introduceerde ook een kleinere en goedkopere versie van het model, o3-mini. Volgens een woordvoerder noemde OpenAI het nieuwe model niet o2 'uit respect' voor een Brits telecommunicatiemerk dat dezelfde naam draagt.
Wie het recentste van twaalf opeenvolgende livestreamevenementen van OpenAI bijwoonde, kon hoofdonderzoeker Mark Chen zien uitleggen hoe het nieuwe AI-model o3 op verschillende vlakken aanzienlijk beter presteert dan zijn voorganger o1. Hoe complexer de vragen, hoe beter de prestaties.
- OpenAI heeft o3-modellen gelanceerd die complexere problemen kunnen oplossen dankzij meer reflectie en meer redenerend vermogen.
- De modellen presteren beter dan hun voorgangers op het vlak van wiskunde, codering en wetenschappelijke tests, maar vereisen een aanzienlijke rekenkracht, wat weegt op de kosten.
- OpenAI wil dat de technologie menselijke normen en waarden beter weerspiegelt.
Redeneren, coderen en wiskundige vraagstukken oplossen behoren tot de specialiteiten van o3. Op de Amerikaanse Wiskunde Olympiade (AIME) van dit jaar behaalde o3 een bijna perfecte score van 96,7 procent. Ook als 'wetenschappelijke PhD-student' blinkt o3 uit met een score van 87,7 procent in de GPQA Diamond, een toets die vragen over biologie, natuurkunde en scheikunde omvat. Bovendien overtreft o3 zijn voorganger o1 aanzienlijk in coderingsvaardigheden. Nochtans introduceerde het door Microsoft gesteunde bedrijf de modellen o1 en o1-mini pas in september.
Antwoord van 1.000 dollar
De prestaties van de o3-modellen hangen sterk af van de rekenkracht - en dus van hoeveel je ervoor betaalt. Het beantwoorden van een vraag met het meest geavanceerde o3-model kan volgens het platform ArcPrize meer dan 1.000 dollar (960 euro) kosten, terwijl de standaardversie tussen 10 en 100 dollar per taak zit. Voor versie o1 kost een vraag beantwoorden ongeveer 1 dollar.
Op volle capaciteit behaalt het model 87,5 procent op de ARC-AGI-benchmark, een test die wordt beschouwd als de standaard voor het evalueren van algemene intelligentie in AI. Dat is niet alleen een enorme sprong voorwaarts ten opzichte van zijn voorganger o1 (32%), maar ook een score die zelfs de menselijke score van 85 procent overtreft. Bij het gebruik van standaardrekenkracht zakt de score evenwel naar 75,7 procent.
Subjectieve kenmerken
OpenAI streeft er tegelijk naar het systeem meer menselijke normen en waarden eigen te maken en racisme en discriminatie weg te werken. 'Dat is niet simpel, omdat de mens geen rationeel wezen is en subjectieve kenmerken heeft', zegt Jorge De Corte, de oprichter van het Belgische AI-bedrijf ReBatch. 'Toch probeert OpenAI het menselijk denken en handelen zo nauwkeurig mogelijk na te bootsen.'
OpenAI probeert het menselijke denken en handelen zo nauwkeurig mogelijk na te bootsen.
OpenAI, dat in San Francisco gevestigd is, kondigde de afgelopen twee weken in livestreams nog andere nieuwigheden aan. Tijdens het evenement '12 Days of OpenAI' maakte het technologiebedrijf de zoekfunctie ChatGPT Search beschikbaar voor elke ingelogde gebruiker, lanceerde het duurdere nieuwe ChatGPT Pro-abonnementsopties en demonstreerde het de AI-videogeneratietool Sora.
De o3-modellen zijn sinds vrijdag beschikbaar voor testen en onderzoeksdoeleinden. Begin volgend jaar zou OpenAI de o3-modellen uitbrengen voor een breder publiek.
Meest gelezen
- 1 Verkoop e-auto's trekt aan, Tesla halveert in Europa
- 2 ‘Van 0 naar 1939 in 3 seconden’: affiches dopen Tesla om tot ‘Swasticar’
- 3 Musk botst op weerstand bij Amerikaanse ambtenaren
- 4 De Wever saneert dit jaar hooguit de helft van wat Europa vraagt
- 5 Jarenlange rechterhand van De Wever maakt comeback in Antwerpse politiek