jailbreaking Archives

Valen Tagliabue, il più famoso “jailbreaker” dell’IA

Si chiamano jailbreaker: testano i modelli di IA inducendoli a violare le proprie regole. Un lavoro essenziale, e psicologicamente devastante. Leggi qui...

30/04/2026

I valori di Claude: Anthropic analizza l’allineamento etico dell’IA

La ricerca di Anthropic esplora i valori espressi da Claude nelle interazioni con gli utenti. Approfondisci qui

07/05/2025

Rivoluzione nel Red-Teaming: Come Haize Labs Sta Trasformando la Sicurezza dei Modelli di Linguaggio

Automazione e Innovazione per Scoprire le Vulnerabilità degli LLM L’automazione del red-teaming nei modelli di linguaggio di grandi dimensioni (LLM) è al centro dell’attenzione di Haize Labs. Questo approccio innovativo promette di rivoluzionare il modo in cui testiamo e miglioriamo la sicurezza e la robustezza di questi potenti strumenti di intelligenza artificiale. Ecco come Haize…

18/07/2024

Sicurezza di Dream Machine bypassata. Allarme pornografia AI

Diversi utenti hanno trovato un modo per “jailbreakare”, ovvero bypassare, le protezioni del generatore AI di video Dream Machine, creando contenuti pornografici e video con nudità. Nonostante i video risultino ancora grezzi e facilmente distinguibili da quelli reali, questo episodio dimostra l’inevitabile evoluzione della tecnologia verso la produzione di contenuti espliciti. Dream Machine, sviluppato da…

20/06/2024

In che modo i cybercriminali sfruttano l’AI

I criminali online si stanno specializzando man mano che si evolve la tecnologia. Il “jailbreak-as-a-service” è emerso tra le nuove tendenze tra i cybercriminali per aggirare le misure di sicurezza delle aziende di intelligenza artificiale e utilizzare i modelli linguistici per scopi dannosi, come la scrittura di codice per ransomware o la generazione di testi…

26/05/2024

Tag: jailbreaking