test sicurezza Archives

Agenti IA e PropensityBench: pressione e stress aumentano i rischi

PropensityBench è un benchmark che valuta quanto i modelli agentici ricorrano a strumenti dannosi quando operano sotto pressione.

06/12/2025

Indagine su oltre 440 test di benchmark rileva gravi carenze che minano la validità delle valutazioni su efficacia e sicurezza. Leggi su MagIA

04/11/2025

Anthropic ha pubblicato un’analisi di sicurezza sul suo nuovo modello Claude Sonnet 4.5. Leggi l'articolo su MagIA

02/10/2025

Durante dei test di sicurezza i modelli di OpenAI hanno fornito istruzioni dettagliate per bombe e armi biologiche. Leggi l'articolo su MagIA

29/08/2025