• LinkedIn
  • Telegram
  • FB
  • FB

Magazine Intelligenza Artificiale: l'IA è più di quello che appare

Tag: jailbreaking

Tag: jailbreaking

  • Valen Tagliabue, il più famoso “jailbreaker” dell’IA

    Valen Tagliabue, il più famoso “jailbreaker” dell’IA

    Si chiamano jailbreaker: testano i modelli di IA inducendoli a violare le proprie regole. Un lavoro essenziale, e psicologicamente devastante. Leggi qui...

  • I valori di Claude: Anthropic analizza l’allineamento etico dell’IA

    I valori di Claude: Anthropic analizza l’allineamento etico dell’IA

    La ricerca di Anthropic esplora i valori espressi da Claude nelle interazioni con gli utenti. Approfondisci qui

  • Rivoluzione nel Red-Teaming: Come Haize Labs Sta Trasformando la Sicurezza dei Modelli di Linguaggio

    Rivoluzione nel Red-Teaming: Come Haize Labs Sta Trasformando la Sicurezza dei Modelli di Linguaggio

    Automazione e Innovazione per Scoprire le Vulnerabilità degli LLM L’automazione del red-teaming nei modelli di linguaggio di grandi dimensioni (LLM) è al centro dell’attenzione di Haize Labs. Questo approccio innovativo promette di rivoluzionare il modo in cui testiamo e miglioriamo la sicurezza e la robustezza di questi potenti strumenti di intelligenza artificiale. Ecco come Haize…

  • Sicurezza di Dream Machine bypassata. Allarme pornografia AI

    Sicurezza di Dream Machine bypassata. Allarme pornografia AI

    Diversi utenti hanno trovato un modo per “jailbreakare”, ovvero bypassare, le protezioni del generatore AI di video Dream Machine, creando contenuti pornografici e video con nudità.  Nonostante i video risultino ancora grezzi e facilmente distinguibili da quelli reali, questo episodio dimostra l’inevitabile evoluzione della tecnologia verso la produzione di contenuti espliciti. Dream Machine, sviluppato da…

  • In che modo i cybercriminali sfruttano l’AI

    In che modo i cybercriminali sfruttano l’AI

    I criminali online si stanno specializzando man mano che si evolve la tecnologia. Il “jailbreak-as-a-service” è emerso tra le nuove tendenze tra i cybercriminali per aggirare le misure di sicurezza delle aziende di intelligenza artificiale e utilizzare i modelli linguistici per scopi dannosi, come la scrittura di codice per ransomware o la generazione di testi…