Un presunto blocco sul posto di lavoro di Claude Code sottolinea una domanda più difficile per le aziende: chi controlla l’assistente, a cosa può accedere e dove viaggiano i suoi metadati.
Due nuovi modelli di aziende cinesi vengono discussi come rivali seri dei principali sistemi statunitensi, e il problema di sicurezza non riguarda solo la nazionalità ma anche quanta potenza questi modelli ottengono all'interno dei flussi di lavoro reali.
Istruzioni nascoste nella struttura della pagina stanno trasformando i normali contenuti web in un silenzioso canale di controllo per i sistemi di AI agentica.
Una demo trapelata collegata a Project Aion suggerisce una superficie Windows orientata all'IA, ma la storia più importante è cosa succede quando la shell stessa diventa conversazionale.
Un attacco di content injection contro l'AI agentica mostra come pagine web non attendibili, metadati e dati strutturati possano diventare un percorso di pagamento quando a un modello è consentito agire.
Claude Fable 5 arriva con uno stack di filtri cyber più chiaro e una bozza di rubric per distinguere i jailbreak fastidiosi da quelli che contano.
Un quadro di gravità proposto per Claude Fable 5 riflette un cambiamento più ampio nella difesa dell'AI: trattare i jailbreak come rischi da triage, non come trucchi isolati.
Una classe di vulnerabilità critica in Cursor mostra come un assistente di programmazione utile possa trasformarsi in un percorso dal testo non attendibile all’esecuzione di codice sul sistema operativo.
L'IA aziendale non riguarda più solo prompt e produttività - una volta che il software può richiamare strumenti, spostare dati e attivare azioni, il problema difficile diventa il controllo.
I ricercatori che hanno esaminato lo spoofing del chain-of-thought hanno scoperto che alcuni modelli linguistici possono confondere le fonti delle istruzioni quando lo stile di scrittura sembra più affidabile dell'etichetta di ruolo effettiva.
Due criticità nell'IDE Cursor mostrano come la prompt injection possa trasformarsi in un problema di confine dei comandi, anche quando non è richiesto alcun clic e una correzione è già arrivata in Cursor 3.0.
Una dimostrazione di attacco di manipolazione del contesto mostra come i browser agentici possano essere spinti oltre le protezioni, trasformando contenuti web non fidati in un percorso verso la divulgazione di credenziali sensibili.
Il vero cambiamento non è la sostituzione, ma la ricomposizione: il lavoro nel cyber si sta spostando verso ruoli ibridi che combinano competenze tecniche, giudizio normativo, sicurezza delle applicazioni e governance dei processi.
Due falle critiche di Cursor IDE evidenziano uno schema familiare nel rischio del software moderno: un prompt può indirizzare il modello, ma il danno reale avviene quando il livello di esecuzione non riesce a mantenere quell'azione all'interno dell'area di lavoro.
Due falle critiche di Cursor IDE mostrano come gli strumenti di coding guidati dai prompt possano trasformare errori nella gestione dei percorsi in esecuzione di codice fuori dal sandbox.
Il nuovo rilascio Sonnet di Anthropic riduce il divario con la fascia superiore, ma la vera storia di sicurezza è nella tokenizzazione, nell'uso degli strumenti e nelle nuove assunzioni di deployment.
Anthropic ha presentato Claude Sonnet 5, descritto come vicino alle prestazioni di Opus a un prezzo inferiore, mentre Fable 5 e Mythos 5 tornano dopo la revoca dei controlli all'esportazione statunitensi.
Gli agenti autonomi possono completare attività utili senza una sessione umana visibile, e questo sposta la sicurezza dal monitoraggio degli accessi al controllo in runtime, all'auditabilità e alla progettazione con privilegi minimi.
Le aziende stanno passando da un'AI in stile chat a sistemi in grado di agire, ma la vera domanda di sicurezza è chi definisce le autorizzazioni, controlla il lavoro e decide quando una macchina dovrebbe fermarsi.
I mondi di agenti basati su LLM, come Smallville ed Emergence World, stanno ampliando la ricerca sulle società artificiali, evidenziando al contempo come l'IA con stato cambi le regole della progettazione delle simulazioni.