NETCROOK

Sabato 04 Luglio 2026 22:40:48 GMT+02:00

#cyber safeguards

Anthropic Trasforma i Jailbreak dell'IA in un Problema di Valutazione

03 Luglio 2026 10:14Sicurezza IA e sistemi agenticiNord America / USAKERNELWATCHER

Claude Fable 5 arriva con uno stack di filtri cyber più chiaro e una bozza di rubric per distinguere i jailbreak fastidiosi da quelli che contano.

#Claude Fable 5 | #AI jailbreaks | #safety classifiers

Il nuovo modello di punta di OpenAI traccia un perimetro di sicurezza attorno alla potenza dell'IA

29 Giugno 2026 08:19Sicurezza dell'IA e sistemi agenticiNord America / USAKERNELWATCHER

GPT-5.6 arriva come anteprima limitata con tre livelli, ma la vera notizia è il forte legame tra le affermazioni sulle capacità cyber e i controlli di sicurezza attorno a Sol, il modello di punta.

#GPT-5.6 | #Sol | #cyber safeguards

Anthropic traccia un confine cyber attorno al suo modello più potente

10 Giugno 2026 16:58Sicurezza AI e sistemi agenticiNord America / USAINTEGRITYFOX

Un nuovo rilascio ha separato un unico sistema frontier in una versione pubblica e in un gemello ristretto, mostrando come i fornitori di AI stiano iniziando a trattare la capacità cyber come un problema di controllo degli accessi, non solo come un lancio di prodotto.

#Claude Fable 5 | #Claude Mythos 5 | #cyber safeguards