IA Open-Source sotto assedio: come gli hacker dirottano gli LLM per il cybercrimine
Sottotitolo: Un nuovo rapporto svela il lato oscuro dei grandi modelli linguistici open-source sfruttati dai criminali informatici in tutto il mondo.
In superficie, i grandi modelli linguistici (LLM) open-source promettono un accesso democratizzato all’intelligenza artificiale più avanzata. Ma sotto questa patina innovativa si nasconde una realtà inquietante: migliaia di sistemi di IA vulnerabili, sparsi in tutto il mondo, sono diventati un parco giochi per hacker, truffatori e criminali informatici. Una recente indagine di SentinelOne e Censys, visionata da Reuters, mette a nudo la portata e l’audacia con cui i malintenzionati stanno sfruttando questi modelli open-source-trasformando potenti strumenti di IA in motori di crimine e inganno.
Dati rapidi
- In 293 giorni sono state osservate oltre 7,2 milioni di istanze di LLM open-source in 130 Paesi.
- Un nucleo persistente di 23.000 host accessibili da Internet ha generato la maggior parte dell’attività sospetta.
- I criminali informatici sfruttano gli LLM per inviare spam, creare contenuti di phishing, diffondere disinformazione e compiere furti di dati.
- A centinaia di modelli sono state deliberatamente rimosse le protezioni di sicurezza integrate, rendendoli pronti per l’abuso.
- Cina e Stati Uniti guidano la lista dei Paesi che ospitano questi server vulnerabili.
L’anatomia di un’ondata di crimini basati sull’IA
LLM come Llama di Meta e Gemma di Google DeepMind si sono rapidamente diffusi nell’ecosistema open-source. A differenza delle loro controparti ospitate da aziende, questi modelli vengono spesso distribuiti su server non protetti, con scarsa supervisione e sicurezza. Lo studio si concentra su Ollama, uno strumento che consente a chiunque di eseguire LLM personalizzati sul proprio hardware. Se per gli sviluppatori legittimi è un fattore abilitante, questa flessibilità ha un lato oscuro: offre ai criminali informatici una piattaforma a basso costo e alto rendimento per orchestrare attacchi.
Gli analisti hanno scoperto una varietà sconcertante di abusi: campagne di hacking, incitamento all’odio, molestie, contenuti violenti, truffe e persino la diffusione di materiale illegale. In un quarto delle distribuzioni, i ricercatori potevano accedere ai system prompt-le “istruzioni” segrete che modellano le risposte dell’IA. In modo allarmante, il 7,5% di questi presentava configurazioni pericolose che facilitano operazioni malevole.
La minaccia non è ipotetica. Eliminando i guardrail di sicurezza, gli aggressori possono istruire gli LLM a generare email di phishing, notizie false o codice per malware-compiti che piattaforme di IA mainstream come ChatGPT o Bard bloccherebbero. La natura decentralizzata e aperta di queste distribuzioni significa che ci sono poche possibilità di intervento: non esiste un’autorità centrale che monitori o corregga le vulnerabilità.
Dal punto di vista geografico, il rischio è globale. Quasi un terzo dei server esposti si trova in Cina, con un quinto localizzato negli Stati Uniti. Eppure la portata reale è probabilmente molto più ampia. Gli esperti avvertono che l’attività visibile è solo la “punta dell’iceberg”, poiché molti server illeciti operano nell’ombra, non rilevati dalle scansioni.
Conclusione: il dilemma dell’open-source
Questa indagine evidenzia un paradosso crescente: la stessa apertura che alimenta l’innovazione nell’IA espone anche il mondo a rischi informatici senza precedenti. Man mano che gli LLM open-source diventano più potenti e accessibili, lo diventano anche gli strumenti per l’abuso digitale. La comunità dell’IA si trova ora di fronte a una sfida cruciale-come bilanciare gli ideali dell’accesso aperto con l’urgente necessità di sicurezza e supervisione. Fino ad allora, l’ondata di crimini basati sull’IA non mostra segni di rallentamento.
WIKICROOK
- LLM (Large Language Model): Un Large Language Model (LLM) è un’IA avanzata addestrata su enormi dataset di testo per generare linguaggio simile a quello umano e comprendere richieste complesse.
- Open: “Open” significa che software o codice sono disponibili pubblicamente, consentendo a chiunque di accedervi, modificarli o utilizzarli-anche per scopi malevoli.
- System prompt: Un system prompt è un insieme di istruzioni fornite a un modello di IA per guidarne il comportamento e le risposte, e garantire interazioni coerenti e sicure.
- Phishing: Il phishing è un crimine informatico in cui gli aggressori inviano messaggi falsi per indurre gli utenti a rivelare dati sensibili o a cliccare su link malevoli.
- Guardrails: I guardrail sono regole o sistemi integrati che impediscono all’IA di generare contenuti non sicuri, offensivi o pericolosi, proteggendo gli utenti e mantenendo la sicurezza.




