Gli agenti autonomi possono completare attività utili senza una sessione umana visibile, e questo sposta la sicurezza dal monitoraggio degli accessi al controllo in runtime, all'auditabilità e alla progettazione con privilegi minimi.
Una dimostrazione di bypass contro ClawHub, Cisco e Vercel mostra che le scansioni prima dell'installazione possono ridurre il rischio, ma non rendono affidabili per impostazione predefinita le skill degli agenti.
Un nuovo argomento di sicurezza dei sistemi afferma che il rischio dell’IA risiede ormai nell’accesso agli strumenti, nell’isolamento del runtime e nel controllo del flusso di informazioni, non solo in output del modello più sicuri.