Advertentie

Francesco Nori (Google DeepMind): 'De vraag is niet meer óf de robots komen, maar wanneer'

Deze week toonde de start-up Figure een video waarin zijn robot Figure 01 soepel beweegt en converseert. ©rv

Is het moment aangebroken voor de multitaskende mensachtige robot, die thuis uw was plooit en uw drankje brengt? Volgens Francesco Nori, directeur robotica bij het legendarische AI-lab Google DeepMind, staan we op een kantelpunt. 'Ik spreek niet meer over twintig jaar, maar over vijf jaar.'

Een man in een zwart hemd staat tegenover een blinkende, mensachtige robot. Wat ziet de robot, vraagt hij. 'Een rode appel op een bord in het midden op de tafel, een droogrek met borden en een mok, en jij die vlakbij staat met je hand op de tafel.' De robot spreekt met een natuurlijke stem. De man vraagt iets te eten en de robot reikt met een soepele beweging de appel aan. 'Dat was het enige eetbare op tafel', zo legt de machine uit. Ondertussen gooit hij drie proppen in een mand. Waar zouden een bord en een mok die op tafel staan naartoe moeten, zo vraagt de man vervolgens. De robot pauzeert en antwoordt dan: 'die moeten wellicht in het droogrek'. Zonder problemen zet hij ze vervolgens in dat rek.

Dit is wat er gebeurt in een kort filmpje dat de Californische start-up Figure afgelopen woensdag online zette. Figure werd in 2022 opgericht met de bedoeling een robot te bouwen die eruitziet en beweegt als een mens. Het bedrijf haalde al honderden miljoenen op bij softwaregigant Microsoft, chipontwikkelaar Nvidia en retailer Amazon. Amazon-oprichter Jeff Bezos investeerde ook via zijn fonds Explore Investments. Twee weken geleden ging Figure in zee met ChatGPT-ontwikkelaar OpenAI en nu is er dus Figure 01, een prototype dat schijnbaar vlot communiceert en met veel souplesse allerlei handelingen uitvoert.

Advertentie

Ik zit al twintig jaar in de business en dit zijn veruit de spannendste tijden.

Francesco Nori
Directeur robotica bij Google DeepMind

Het filmpje maakte sensatie in de techwereld. Dat assemblagelijnen in autofabrieken door gigantische robotarmen worden bemand, dat kennen we. Maar een mensachtige butler die kan multitasken in huis of zorgtaken op zich kan nemen, dat leek tot nu toe een eeuwige belofte.

De roboticapionier Rodney Brooks bracht in 2011 Baxter op de markt, een robot die bewegingen nauwkeurig kon nadoen. Dat creëerde hooggespannen verwachtingen, maar die werden daarna nooit ingelost. Tot nu? De interesse is in elk geval groot. Het Noorse roboticabedrijf 1X Technologies haalde onlangs 100 miljoen dollar op om zijn mensachtige butler NEO naar de markt te brengen.

Amazon investeerde in Agility Robotics en test de tweevoetige robot Digit van dat bedrijf in zijn warenhuizen. Het Canadese Sanctuary Cognitive Systems bracht vorig jaar Phoenix op de markt, een humanoïde die het werk moet verlichten. En ook de Amerikaanse miljardair Elon Musk stortte zich op de markt. Met zijn autobedrijf Tesla bouwt hij aan een eigen menselijke robot, Optimus. Die kan intussen rondwandelen, een ei oprapen en de was plooien.

De vraag is alleen: hoever staan al die initiatieven nog van de dagelijkse praktijk? In een filmpje uit januari bleek de Optimus de was alleen te kunnen plooien omdat het hem eerst werd getoond. Het filmpje was, zoals wel vaker gebeurt, versneld opgenomen om de bewegingen soepeler te laten lijken. Bij Figure 01 is dat niet het geval. De robot reageert met vertraging, maar veel sneller dan tot nu mogelijk was. Hij lijkt alles ook verbazend goed te begrijpen.

'Ik zit al twintig jaar in de business en dit zijn veruit de spannendste tijden', reageert Francesco Nori vanuit Londen. De 47-jarige Italiaan is directeur robotica bij Google DeepMind, het AI-lab van de techgigant Alphabet dat vorig jaar ontstond uit de fusie van Google Brain in Silicon Valley en het legendarische Londense onderzoekslabo DeepMind. (zie inzet) Volgende week is hij een van de sprekers op de Gentse editie van het Vlaams technologiefestival FTI.

Advertentie
Google DeepMind

Google DeepMind is het AI-lab van de techgigant Alphabet. Het ontstond vorig jaar uit de fusie van het Londense Deepmind en Google Brain uit Silicon Valley. Er werken alles samen zo'n 2.000 mensen. In de roboticadivisie zijn dat er zo'n 200.

DeepMind is een van de meest legendarische AI-onderzoekscentra ter wereld. Het werd in 2010 opgericht door Demis Hassabis, Shane Legg en Mustafa Suleyman. Hassabis is nog altijd de CEO. Vorige week raakte bekend dat hij is opgenomen in de pauselijke Academie voor de Wetenschappen, een instituut dat de ontwikkelingen in de wetenschap bespreekt en advies geeft aan het Vaticaan.

In 2014 werd DeepMind voor 500 miljoen dollar verkocht aan Google. De jaren daarna ontpopte het labo zich tot een pionier in artificiële intelligentie. Zo ontwikkelde het AlphaGo, een programma dat in 2016 de wereld verbaasde door de wereldkampioen Lee Sedol in het bordspel go te verslaan. Go wordt gezien als een van de meest complexe bordspellen ter wereld. Voor die prestatie moest AlphaGo strategisch kunnen redeneren.

Advertentie

In 2018 lanceerde DeepMind een eerste versie van AlphaFold, een programma dat in staat was de structuur van eiwitten te voorspellen, een belangrijke doorbraak voor biologisch onderzoek. Een groot deel van het werk dat Google DeepMind vandaag doet, is gericht op bijdrages aan de wetenschap.

De fusie met Google Brain kwam er vorig jaar om de AI-inspanningen van Alphabet beter te stroomlijnen. Sinds de lancering van de conversatiebot ChatGPT door OpenAI, dat wordt gesteund door Microsoft, zit Alphabet in de achtervolging.

Nori, een fervent zeiler uit Padua, verliet zes jaar geleden Italië voor een job bij DeepMind. 'Ze wilden hun modellen van machinelearning toepassen op robots', zegt hij. 'Dat was toen een totaal nieuwe benadering. In plaats van alles wat de robot doet te laten coderen door ingenieurs was het de bedoeling dat de robots zelf konden leren.'

Dat bleek een eerste, belangrijke stap. Het filmpje dat Figure deze week op de wereld losliet, toont een volgende mijlpaal. Dat robotica nu ook wordt gecombineerd met grote taalmodellen zoals GPT, het systeem waarop de conversatiebot ChatGPT draait, opent nieuwe deuren.

'Het ChatGPT-moment heeft veel veranderd, veel meer dan ik zelf voor mogelijk hield', zegt Nori. 'Door een taalmodel met gigantisch veel data te voeden bleek dat plots in staat eender welke vraag te beantwoorden of eender welk beeld te genereren. Tot dan dacht ik dat je pas een beeld kon oproepen als je eerst met een complex model de omgeving had beschreven en specificaties had gegeven over onder meer de lichtreflectie. Maar dat was plots niet meer nodig.'

Francesco Nori
Francesco Nori

'Robots beheersen nu dus ook taal. Daardoor wordt de communicatie veel gemakkelijker. Je moet geen softwareingenieur meer zijn om ermee te praten. En als je met een taalmodel tekst en beelden kan genereren, waarom zou je dan geen bewegingen kunnen genereren?'

Betekent dit dat het ChatGPT-moment voor robots nabij is, dat we straks multifunctionele robots hebben die zelf redeneren en uiteenlopende taken aankunnen?

Nori: 'We zitten zeker op een kantelpunt. Er beweegt enorm veel en er zijn steeds meer grote bedrijven die geld pompen in de ontwikkeling. Dat zal de vooruitgang pushen. Maar als ik kantelpunt zeg, dan bedoel ik dat vooral op het vlak van onderzoek. Er is wel nog een weg af te leggen voor je die robots in je dagelijkse omgeving ziet.'

Waar zullen we die robots het eerst zien opduiken?

Nori: 'De meest voor de hand liggende toepassing zijn zelfrijdende auto's. Dat zijn eigenlijk ook robots. In Californië rijden zulke taxi's rond (de Alphabet-dochter Waymo breidde onlangs haar zelfrijdende taxidiensten uit naar de Amerikaanse steden Los Angeles en Phoenix, red.). Eigenlijk zijn toepassingen mogelijk in elke omgeving waarin enigszins structuur aan te brengen is. In een distributiecentrum, bijvoorbeeld. In een restaurant zou een robot een tafel kunnen afruimen. Dat is een omgeving die je behoorlijk goed kan afbakenen. In huis zie ik het nog niet werken, want in een huishouden is het veel lastiger om structuur te vinden.'

Als onderzoekers is het onze verantwoordelijkheid hallucinaties te voorkomen.

Francesco Nori
Directeur robotica bij Google DeepMind

In het filmpje dat Figure deze week online zette, lijkt Figure 01 zich wel te gedragen als een huishoudrobot.

Nori: 'Ik heb Figure nog bezocht. Er werken veel mensen die uit het onderzoek komen. Ze hebben zeker stappen vooruitgezet. Dankzij ChatGPT praat je met die robot zoals met een mens. Dat geeft een enorme vrijheid om te communiceren. Maar qua bewegingen is wat we in de video zien nog altijd heel gestructureerd. Ja, de robot kan een appel vastgrijpen. Maar iets vastgrijpen is vrij goed af te bakenen, die techniek beheersen we. Daar werden jaren geleden al papers over geschreven.'

'Iets vastpakken is ook maar een van de vele motorische vaardigheden die we als mens hebben. Veel daarvan beheersen we nog lang niet. Bij het uitschenken van een glas water komt bijvoorbeeld veel meer kijken. Het filmpje van Figure is vooral heel goede pr, omdat het mensen doet dromen van meer. Maar als je voorbij de scope van de demo gaat, zijn we nog veraf van een multi-inzetbare robot die allerlei dagelijkse klusjes doet.'

Veel bedrijven werken nu aan mensachtige robots. Is Google DeepMind daar ook mee bezig?

Nori: 'Nee. Maar dat gaat over de vorm. Het is absoluut ons doel beter te worden in het controleren van bewegingen en meer flexibiliteit mogelijk te maken. Het probleem is dat normaal gezien enorm veel data nodig zijn om robots te trainen. Ze worden meestal ook getraind op één specifieke, geprogrammeerde beweging. Vorig jaar hebben we een grote doorbraak geboekt met RoboCat. Die kan op basis van een beperkt aantal demonstraties zelf trainingsdata genereren en kan dat voor verschillende bewegingen. Dat is een stap in de richting van robots die veel breder inzetbaar zijn en meerdere dingen tegelijk kunnen.'

'Voor zo'n onderzoek gebruiken we doorgaans robotarmen. Mensachtige robots hebben nog veel beperkingen omdat de hardware nog niet op punt staat. Robothanden met vijf vingers zijn nog altijd fragiel. Voor ons onderzoek gebruiken we liever hardware die we dagenlang kunnen testen, desnoods maanden aan een stuk. Daarna zal de vorm wel volgen.'

Dat nu ook taalmodellen worden gebruikt om de robot te bedienen, is een belangrijke doorbraak. Maar van ChatGPT weten we dat die systemen soms hallucineren. Is dat voor robots geen bijzonder groot probleem?

Nori: 'Veiligheid is een van de uitdagingen die we absoluut moeten oplossen. Zeker bij deze technologie. Een groot deel van onze mensen werkt op het voorkomen van dat soort hallucinaties. Als onderzoekers is het onze verantwoordelijkheid daarmee bezig te zijn. Dat is trouwens ook deel van de cultuur bij Google DeepMind. We willen pas iets lanceren als we zeker zijn dat het geen gevaar inhoudt voor de mensheid of geen schade aanricht. Soms gaan we daar te ver in en worden we het slachtoffer van onze eigen waarden, zoals bij de beeldgenerator in onze chatbot Gemini. We wilden genoeg diversiteit inbouwen en alle bevolkingsgroepen gelijk behandelen. Maar dat kwam als een boemerang terug in ons gezicht.'

Gemini genereerde beelden van Aziatische nazi's, zwarte Vikings en een vrouwelijke paus. Dat leidde tot de beschuldiging dat het systeem te woke was. Het moest zelfs een tijd offline worden gehaald.

Nori: 'We zijn daarin doorgeschoten, ja. Het is een moeilijk evenwicht. Maar iedereen bij Google DeepMind is ervan doordrongen dat we genoeg vangrails moeten inbouwen, zodat deze technologie ten goede en niet ten kwade kan worden gebruikt.'

Ik zie vooral een gevaar als we niet vasthouden aan onze waarden. Niet alleen voor ons, maar voor de mensheid.

Francesco Nori
Directeur robotica bij Google DeepMind

Het wekte vooral de indruk dat u in het defensief zit. Sinds de lancering van ChatGPT hinkt het moederbedrijf Alphabet achterop.

Nori: 'Dat heeft te maken met onze voorzichtigheid. Dat we daar niet op willen inboeten, heeft een prijs. We waren verrast dat OpenAI ChatGPT lanceerde zonder de mogelijkheid om de gegenereerde content een watermerk te geven. Dat laat toe te achterhalen of iets door generatieve AI is gemaakt. Wij waren daar op dat moment hard mee bezig, want volgens ons is het essentieel om de technologie veilig en controleerbaar te maken. En dan komt er een nieuwe speler die zich duidelijk minder zorgen maakt over zulke vangrails en het systeem gewoon lanceert. Dat geeft ze dan het first mover advantage.'

Het brengt u wel in lastig parket. De race wordt gelopen in een verschroeiend tempo.

Nori: 'Ik zie vooral een gevaar als we niet vasthouden aan onze waarden. Niet alleen voor ons, maar voor de mensheid. Als medewerkers vinden dat we niet snel genoeg gaan, verlaten ze het bedrijf en gaan ze elders een gemakkelijkere job doen voor meer geld (in veel AI-bedrijven werken vandaag mensen die van DeepMind komen, red.). Goed nadenken over welke beperkingen je wil inbouwen in je systemen maakt alles nu eenmaal complexer. We maken het onszelf niet per se gemakkelijk, dat beseffen we.'

De hype rond AI is enorm en de verwachtingen zijn hooggespannen. Zal de technologische ontwikkeling snel blijven gaan?

Nori: 'Ik denk het wel. Er zijn zeker nieuwe doorbraken mogelijk. Maar het zal ervan afhangen waar het onderzoeksveld zijn schouders onder zet. Zo gaat het altijd. Op een bepaald moment ging iedereen voor beeldherkenning. Iedereen wilde de eerste zijn. Toen kwam ImageNet (een uitgebreide database van gelabelde afbeeldingen die als benchmark is gebruikt om computers te trainen in het herkennen van objecten, red.). Vervolgens werd taal de uitdaging. Als dat is opgelost en iedereen zich tot robotica bekeert, verwacht ik daar een enorme versnelling.'

Als mensen plots massaal schrik krijgen voor zo'n technologie, kan dat een grote rem zetten.

Francesco Nori
Directeur robotica bij Google DeepMind

Als iedereen er zijn schouders onder zet, hoe snel zien we die multitaskende robots dan in ons huis opduiken?

Nori: 'Die vraag krijg ik al sinds het begin van mijn carrière. Het antwoord was altijd 'over twintig jaar'. En dat schoof elk jaar mee op. Maar ik heb nu wel het gevoel dat er van alles aan het veranderen is. Dus ik volg wat onze baas bij Google DeepMind (Demis Hassabis, red.) daarover zegt: we zijn op het punt gekomen dat het geen kwestie meer is óf we het technologisch vraagstuk opgelost krijgen, maar wanneer. Dat is altijd een belangrijk moment.'

'Daarna hangt het ervan af of genoeg wordt geïnvesteerd en of de publieke opinie mee is. Als mensen zich plots massaal zorgen beginnen te maken en schrik krijgen voor zo'n technologie, kan dat een grote rem zetten. Maar de hype is ontegensprekelijk groot. Als iedereen de krachten bundelt, is altijd veel meer mogelijk dan we denken. Kijk naar wat we in de pandemie hebben gedaan met de vaccins tegen covid. Dus zeg ik nu niet meer over twintig jaar, maar over vijf jaar.'

Kan Europa een rol spelen? Het hoofdkantoor van Google DeepMind is in Londen. U bent Italiaan. Er zijn initiatieven als het Franse Mistral en het Duitse Aleph Alpha, maar kunnen we in Europa nog een vuist maken tegen de Amerikaanse suprematie?

Nori: 'Ik ben de voorbije jaren betrokken bij veel Europese projecten en zou graag willen dat er meer investeringen komen in robotica en in AI in het algemeen. Omdat het technologie is die ons veel goeds kan brengen, bijvoorbeeld bij nieuwe wetenschappelijke doorbraken. Kijk naar AlphaFold, de AI-tool die we bij Google DeepMind hebben gebouwd om de structuren van eiwitten te voorspellen. Die kan een enorme bijdrage leveren aan biologisch onderzoek en aan de ontwikkeling van nieuwe medicijnen.'

Maar kunnen we nog een rol van betekenis spelen?

Nori: 'De reden dat Europa achterloopt in AI moet je zoeken in de infrastructuur die nodig is om de technologie te ontwikkelen. Om de een of andere reden is die hier niet aanwezig. Grote dotcombedrijven als Google en Amazon hebben miljoenen computers die ze kunnen inzetten voor de ontwikkeling van AI. Dus voor hen was het gemakkelijk om die stap te zetten. Maar nu computerkracht voor iedereen toegankelijk wordt - je huurt gewoon rekenkracht om je modellen te trainen - zie ik geen reden waarom het hier niet zou kunnen. De middelen zijn er.'

'Het is volgens mij zeker niet te laat om nog relevant te zijn. Veel technologie is open source. Als je geen geld wil betalen aan een Amerikaanse speler voor zijn rekenkracht, kan je zelfs nog je eigen datacenter bouwen. Dat is allemaal geen rocketscience. Het komt er gewoon op aan te investeren, de knowhow te creëren en genoeg projecten op te starten.'

Advertentie

In het nieuws

Alle artikels meer
Vakbonden verwachten tienduizenden betogers in Brussel, grote hinder in de maak
Alleen al uit Vlaanderen verwachten de vakbonden dat er maandag meer dan 20.000 leerkrachten gaan betogen in Brussel. Er wordt grote hinder verwacht. Slechts één op de drie treinen zal rijden, en ook het Brusselse openbaar vervoer wordt getroffen. Ook op de luchthaven zijn acties gepland. Brussels Airlines annuleert de helft van zijn Europese vluchten.