Sakana ha annunciato che la sua IA, The AI Scientist v2, avrebbe generato la sua prima pubblicazione scientifica sottoposta al processo di peer review. La notizia, sebbene parzialmente fondata, richiede alcune considerazioni importanti per essere inquadrata correttamente. The AI Scientist ha effettivamente prodotto un paper che è stato “accettato” per il workshop di una conferenza, ma non è stato oggetto di un’analisi approfondita.
Per questo esperimento, Sakana ha collaborato con ricercatori dell’Università della Colombia Britannica e di Oxford, inviando tre paper generati dall’IA come proposte per un workshop dell’ICLR, una prestigiosa conferenza nel campo dell’IA, previa autorizzazione da parte degli organizzatori. Uno dei tre paper è stato accettato e Sakana lo ha poi ritirato per motivi di trasparenza e nel rispetto delle convenzioni della conferenza. Il paper di AI Scientist non ha dunque completato l’intero processo di peer review, come normalmente accade affinchè una pubblicazione scientifica possa definirsi tale. Inoltre, i workshop delle conferenze hanno generalmente tassi di accettazione più elevati rispetto al programma principale.
Matthew Guzdial dell’Università dell’Alberta ha criticato l’esperimento definendo i risultati “fuorvianti” e sottolineato che la selezione dei paper più promettenti ha avuto un ruolo determinante. Mike Cook, ricercatore presso il King’s College di Londra, ha posto l’accento sulla differenza tra superare una revisione e contribuire effettivamente alla conoscenza scientifica. Sakana, dal canto suo, non ha mai sostenuto che la sua IA possa produrre ricerche rivoluzionarie. L’azienda ha dichiarato che l’obiettivo dell’esperimento era “studiare la qualità della ricerca generata dall’IA” e sottolineare l’urgente necessità di una regolamentazione sul tema.
Leggi l’articolo completo “Sakana claims its AI-generated paper passed peer review — but it’s a bit more nuanced than that” su TechCrunch
Immagine generata tramite DALL-E 3. Tutti i diritti sono riservati. Università di Torino (2025)

