Tag: jailbreaking
Tag: jailbreaking
-

Valen Tagliabue, il più famoso “jailbreaker” dell’IA
Si chiamano jailbreaker: testano i modelli di IA inducendoli a violare le proprie regole. Un lavoro essenziale, e psicologicamente devastante. Leggi qui...
-

I valori di Claude: Anthropic analizza l’allineamento etico dell’IA
La ricerca di Anthropic esplora i valori espressi da Claude nelle interazioni con gli utenti. Approfondisci qui
-

Rivoluzione nel Red-Teaming: Come Haize Labs Sta Trasformando la Sicurezza dei Modelli di Linguaggio
Automazione e Innovazione per Scoprire le Vulnerabilità degli LLM L’automazione del red-teaming nei modelli di linguaggio di grandi dimensioni (LLM) è al centro dell’attenzione di Haize Labs. Questo approccio innovativo promette di rivoluzionare il modo in cui testiamo e miglioriamo la sicurezza e la robustezza di questi potenti strumenti di intelligenza artificiale. Ecco come Haize…
-

Sicurezza di Dream Machine bypassata. Allarme pornografia AI
Diversi utenti hanno trovato un modo per “jailbreakare”, ovvero bypassare, le protezioni del generatore AI di video Dream Machine, creando contenuti pornografici e video con nudità. Nonostante i video risultino ancora grezzi e facilmente distinguibili da quelli reali, questo episodio dimostra l’inevitabile evoluzione della tecnologia verso la produzione di contenuti espliciti. Dream Machine, sviluppato da…
-

In che modo i cybercriminali sfruttano l’AI
I criminali online si stanno specializzando man mano che si evolve la tecnologia. Il “jailbreak-as-a-service” è emerso tra le nuove tendenze tra i cybercriminali per aggirare le misure di sicurezza delle aziende di intelligenza artificiale e utilizzare i modelli linguistici per scopi dannosi, come la scrittura di codice per ransomware o la generazione di testi…
