Advertentie

'Autonome' AI-bot Claude laat glimp van de toekomst zien, maar moet nog veel leren

©rv

Het Californische Anthropic laat de AI-bot Claude uw computerscherm lezen en vervolgens de computer gebruiken om opdrachten uit te voeren. Het heeft iets magisch, maar zit nog in een vroege fase. Het achterliggende idee - AI die voor u opdrachten autonoom uitvoert - is wel de volgende stap in de AI-race.

De Californische AI-start-up Anthropic wekt enthousiasme op X met zijn nieuwe versie van het Claude 3.5 Sonnet-model. Dat kan tot op zekere hoogte redeneren en stuurt een bot aan, Claude, die nu ook autonoom opdrachten kan uitvoeren. We deden een test.

We vragen aan Claude een webpagina voor een jiujitsuclub te maken. Dat met een gewone instructie in een tekstvenster. De webpagina moet worden gemaakt in HTML, de computertaal die de structuur van een webpagina definieert, en in CSS, de code nodig voor de opmaak en het uiterlijk van de pagina.

Ik lanceer een tool om de code te schrijven en maak voor jou de HTML.

Claude
AI-bot van Anthropic

'Ik lanceer een tool om de code te schrijven en maak voor jou de HTML', schrijft het AI-systeem terug. Het neemt een screenshot van het computerscherm en kan zo de nodige icoontjes vinden om op te klikken. Het kan teksten en code schrijven. Al heel snel zien we de HTML-pagina. 'Het bestand is succesvol gecreëerd', staat er vervolgens.

Waarop razendsnel ook de CSS wordt aangemaakt. Claude zegt waar op mijn computer de bestanden zijn te vinden en doet de Firebox-browser tot leven komen. Daar wordt de webpagina in haar volle glorie getoond. Met in de kolom de historiek van de werkzaamheden waarbij elke muisbeweging en klik worden vermeld, een uitvoerige uitleg over de nieuwe pagina en een hele reeks screenshots.

Bij een zoekopdracht stoot het systeem op een cookiemelding. Net zoals de meeste menselijke gebruikers besluit de AI om op 'aanvaard alles' te klikken. In dit geval wellicht vrij onschuldig, maar wat als het gaat over meer risicovolle beslissingen?  Anthropic raadt af het systeem te laten posten op sociale media, accounts aan te laten maken of gebruik te laten maken van overheidswebsites. In sommige gevallen zal Claude zelf instructies volgen die het vindt op het internet, ook al botsen die met instructies van de gebruiker. Daarom moet het experiment worden afgeschermd en is het ook niet bestemd voor de consument.

Advertentie

Ontwikkelaars

Het gaat over een verregaande automatisering van administratief werk.

Het is de bedoeling dat ontwikkelaars met de nieuwe functionaliteit, die Computer Use heet, aan de slag gaan. Die kunnen er nieuwe toepassingen mee bouwen en het achterliggende model gebruiken. Computer Use kan je niet gebruiken door eventjes naar een website te surfen. Je moet bij Anthropic eerst een API-sleutel aanmaken die je nodig hebt om met het model te kunnen werken. Die sleutel bestaat uit een lange reeks letters en cijfers. Daarbij moet je tokens - elementaire informatie-eenheden - kopen.

Ons experiment, waarbij we de bot autonoom zaken laten opzoeken, code schrijven en zelfs een virtuele piano laten bespelen, blijkt een paar dollar te kosten. We volgen de aanbeveling Docker te installeren, een virtuele container die het experiment afschermt van de rest van de computer.

Advertentie

Vervolgens kunnen we in een gewone browser naar een pagina waar we de bot instructies geven en we de werkzaamheden kunnen volgen. Het is allemaal geen rocketscience, maar voor veel consumenten een aantal bruggen te ver. Anthropic zal in de toekomst enkele van de nieuwe mogelijkheden op een veilige manier integreren in zijn consumentenproducten.

Claude | Computer use for automating operations

Maar het is in het professionele leven dat dit soort ontwikkelingen grote impact gaan hebben. In een video toont Anthropic hoe Claude een formulier invult met informatie die van elders op de computer komt. De bot 'kijkt' met screenshots, beweegt de cursor, klikt en typt om de informatie te vinden en vervolgens in te vullen en in te dienen. Het is een verregaande automatisering van administratief werk.

Fouten

Microsoft, SAP, Oracle en Salesforce zijn enkele van de grote namen die AI-agenten aanbieden, maar er zijn ook tal van kleinere spelers actief. De aanpak van Anthropic valt op omdat Claude een menselijke gebruiker simuleert door te kijken en vervolgens met een virtuele muis en toetsenbord zelfstandig aan de slag te gaan.

Dat gezegd zijnde, Anthropic geeft toe dat het project nog in een vroege fase zit. Claude kan er regelmatig naast zitten en heeft moeite met scrollen en zoomen. Menselijke assistenten moeten nog niet onmiddellijk voor hun baan vrezen.

Advertentie
Gesponsorde inhoud