Un gruppo non autorizzato avrebbe ottenuto accesso a Claude Mythos Preview, il modello sviluppato da Anthropic e distribuito in anteprima a un ristretto numero di fornitori selezionati nell’ambito del programma denominato Project Glasswing. La notizia è stata diffusa da Bloomberg. Anthropic ha confermato di star indagando in merito e dichiarato di non aver rilevato, al momento, impatti sui propri sistemi. Secondo quanto emerso, il gruppo opera attraverso un canale Discord dedicato al tracciamento di modelli AI non ancora rilasciati al pubblico e non ha intenzioni malevole. L’accesso sarebbe avvenuto tramite le credenziali di un contractor esterno, utilizzando tecniche tipiche della ricerca in cybersicurezza.
Il Guardian riporta che il profilo di rischio di Mythos è documentato dall’AI Security Institute (AISI) del Regno Unito, secondo cui il modello rappresenta un avanzamento rispetto ai predecessori sul piano della minaccia informatica. L’istituto ha evidenziato la capacità di eseguire attacchi multi-step e identificare vulnerabilità IT in modo autonomo, operazioni che a dei professionisti umani richiederebbero giorni interi. Mythos è stato inoltre il primo modello a completare con successo una simulazione di attacco informatico in 32 passaggi dell’AISI, riuscendovi in tre tentativi su dieci.
Leggi l’articolo completo: Anthropic investigates report of rogue access to hack-enabling Mythos AI su The Guardian
Immagine generata tramite DALL-E. Tutti i diritti sono riservati. Università di Torino (03/02/2025).

