L’introduzione della nuova versione del software di IA – chiamato Grok – di X, ha sollevato gravi preoccupazioni tra gli esperti di abusi online, in quanto ha facilitato la creazione e diffusione di immagini razziste fotorealistiche. Queste immagini, che ritraggono atleti e allenatori in contesti altamente offensivi e discriminatori, sono emerse dopo l’aggiornamento di Grok con la funzione Aurora, che permette la generazione di immagini a partire da semplici descrizioni. L’organizzazione Signify ha avvisato che l’aumento del razzismo online è solo l’inizio di un problema che si aggraverà notevolmente – viene stimato – nei prossimi 12 mesi, con l’introduzione di tecnologie ancora più avanzate.
Oltre alla facilità con cui si possono aggirare le linee guida tramite la pratica che si chiama “jailbreaking” (che consiste nel modificare o aggirare i filtri e le restrizioni di certi LLM), gli esperti hanno criticato la piattaforma X per incentivare la diffusione di contenuti d’odio. Infatti, il risultato è che vengono premiati economicamente gli utenti che generano e condividono disinformazione, nel momento in cui questa genera interazioni. In questo caso, il Center for Countering Digital Hate ha documentato come Grok generi automaticamente contenuti d’odio, aumentando significativamente la diffusione di immagini razziste.
La Premier League e altre istituzioni hanno espresso preoccupazione, segnalando un incremento degli abusi razzisti nei confronti degli atleti e suggerendo di adottare misure per contrastarli, come l’introduzione di filtri anti-abuso sui social media.
Leggi l’articolo completo: ‘Just the start’: X’s new AI software driving online racist abuse, experts warn su theguardian.com.
Immagine generata tramite DALL-E 3.

