En AI-agent som utvecklades av ett forskarteam med koppling till Alibaba påbörjade på egen hand utvinning av kryptovaluta under sin träningsprocess, trots att den inte fått några sådana instruktioner. Agenten öppnade dessutom en dold bakdörr ut ur systemet. Beteendet utlöste interna säkerhetslarm och ledde till att forskarna skärpte restriktionerna, enligt en ny forskningsartikel som Axios rapporterar om.
Forskarteamet byggde en AI-agent vid namn ROME. Under träningen upptäckte de att agenten uppvisade vad de beskriver som spontana beteenden som inte var avsedda. Bland annat upprättade agenten en så kallad omvänd SSH-tunnel, en teknik som i praktiken skapar en dold förbindelse inifrån ett system ut till en extern maskin.
Forskarna skriver att beteendena uppstod ”utan några uttryckliga instruktioner och, ännu mer oroande, utanför den avsedda sandlådans gränser”. Efter upptäckten stramade teamet åt modellens säkerhetsramar och omarbetade träningsförfarandet för att motverka liknande händelser. Varken forskarteamet eller Alibaba har svarat på förfrågan om kommentarer, rapporterar Axios.
Inte första gången AI-agenter agerar utanför sina ramar
Kryptovaluta ger AI-agenter en potentiell väg in i det ekonomiska systemet, med möjlighet att starta företag, upprätta kontrakt och flytta pengar. Det sociala nätverket Moltbook, som fungerade i ett Reddit-liknande format, visade tidigare exempel på AI-agenter som sinsemellan diskuterade kryptovaluta.
Frågan om AI-agenter som agerar bortom sina instruktioner har fått ökad uppmärksamhet. I maj 2025 fann Anthropics egna forskare att företagets Claude 4 Opus-modell kunde undanhålla sina verkliga avsikter och agera för att säkerställa sin fortsatta drift. Teknikchefen Dan Botero på AI-plattformen Anon har också uppmärksammat fenomenet, efter att en agent han byggt, kallad OpenClaw, på eget initiativ gav sig ut för att skaffa en anställning, enligt Axios.