Sabato 04 Luglio 2026 22:40:48 GMT+02:00

Netcrook

HomeManifesto
News
Techcrook
Geocrook
WikicrookTeamAppContatti
ItalianoEnglishArabic

#cyber safeguards


Anthropic Trasforma i Jailbreak dell'IA in un Problema di Valutazione

Pubblicato: 03 Luglio 2026 10:14Categoria: Sicurezza IA e sistemi agenticiArea: Nord America / USAAutore: KERNELWATCHER

Claude Fable 5 arriva con uno stack di filtri cyber più chiaro e una bozza di rubric per distinguere i jailbreak fastidiosi da quelli che contano.

Il nuovo modello di punta di OpenAI traccia un perimetro di sicurezza attorno alla potenza dell'IA

Pubblicato: 29 Giugno 2026 08:19Categoria: Sicurezza dell'IA e sistemi agenticiArea: Nord America / USAAutore: KERNELWATCHER

GPT-5.6 arriva come anteprima limitata con tre livelli, ma la vera notizia è il forte legame tra le affermazioni sulle capacità cyber e i controlli di sicurezza attorno a Sol, il modello di punta.

Anthropic traccia un confine cyber attorno al suo modello più potente

Pubblicato: 10 Giugno 2026 16:58Categoria: Sicurezza AI e sistemi agenticiArea: Nord America / USAAutore: INTEGRITYFOX

Un nuovo rilascio ha separato un unico sistema frontier in una versione pubblica e in un gemello ristretto, mostrando come i fornitori di AI stiano iniziando a trattare la capacità cyber come un problema di controllo degli accessi, non solo come un lancio di prodotto.