Come anticipato ad inizio aprile, Alibaba ha rilasciato entro la fine del mese Qwen3, l’ultima evoluzione dei modelli linguistici della famiglia Qwen, con dei miglioramenti significativi nelle capacità di ragionamento e prestazioni.
Il modello di punta, Qwen3-235B-A22B, compete a livello di benchmark con altri modelli di fascia alta, mostrando risultati superiori in campi come codifica e matematica. Un’altra versione, il modello MoE di piccole dimensioni chiamato Qwen3-30B-A3B, pur con un numero di parametri inferiore eccelle nel superare modelli precedenti, offrendo una potenza computazionale ottimizzata.
Una delle novità più rilevanti di Qwen3 è l’introduzione di modalità di pensiero ibride. Gli utenti possono scegliere tra una modalità riflessiva, che consente un ragionamento approfondito per compiti complessi, e una modalità non riflessiva per risposte rapide e dirette. Questa flessibilità permette di adattare il modello a una vasta gamma di applicazioni, migliorando l’efficienza nei flussi di lavoro.
Inoltre, Qwen3 supporta 119 lingue e dialetti, favorendo un’accessibilità a livello globale, e ha ottenuto miglioramenti significativi nell’integrazione con strumenti di codifica avanzata. Il modello è ora disponibile su piattaforme come Hugging Face e Kaggle, con il codice sorgente rilasciato sotto licenza Apache 2.0, facilitando l’integrazione in progetti di ricerca e sviluppo.
Per il futuro, i piani includono il continuo miglioramento delle capacità di apprendimento automatico, con l’obiettivo di avvicinarsi sempre di più agli standard dell’IA Generale (AGI).
Leggi l’articolo completo: Qwen3: Think Deeper, Act Faster su qwenlm.github.io.
Immagine generata tramite DALL-E 3. Tutti i diritti sono riservati. Università di Torino (2025).

