OpenAI ha pubblicato un nuovo paper sulla riduzione del bias politico nei suoi modelli di IA, affermando che ChatGPT non dovrebbe mostrare pregiudizi politici in alcuna direzione. Come nota Ars Technica però, OpenAI non fornisce una definizione chiara di “bias” e si concentra principalmente su modifiche comportamentali piuttosto che sulla ricerca di una – presunta – neutralità.
Il paper sostiene che i nuovi modelli GPT-5 mostrino una riduzione del 30% del bias. Tuttavia, un’analisi attenta del documento rivela che OpenAI non definisce mai con precisione cosa intenda con questo termine. Inoltre, le metriche utilizzate non misurano l’accuratezza delle informazioni, bensì specifici comportamenti conversazionali, come l’esprimere opinioni personali, amplificare il linguaggio emotivo degli utenti e fornire copertura unilaterale di temi controversi.
Secondo Ars Technica, il vero problema che OpenAI sta cercando di risolvere è quello della sycophancy, ovvero la tendenza del modello a compiacere l’utente, in questo caso validando le sue posizioni politiche. Questo comportamento deriva dal reinforcement learning, che tende a premiare le risposte che confermano le opinioni dell’utente. Gli interventi di OpenAI mirano a spezzare questo ciclo, rendendo ChatGPT meno propenso a comportarsi come un alleato politico entusiasta e più come uno strumento neutrale.
Il contesto di questi sforzi non è casuale; a luglio l’amministrazione Trump ha emanato un ordine esecutivo che vieta l’IA “woke” dai contratti federali e richiede neutralità ideologica. Presentando questi aggiustamenti comportamentali come ricerca dell'”oggettività”, OpenAI oscura il fatto che sta comunque compiendo scelte valoriali specifiche su come un’IA debba comportarsi, che tra l’altro riflettono norme comunicative occidentali e potrebbero non tradursi universalmente in altri contesti culturali.
Leggi l’articolo completo: OpenAI wants to stop ChatGPT from validating users’ political views su Ars Technica
Immagine generata tramite DALL-E. Tutti i diritti sono riservati. Università di Torino (01/05/2025).

