• LinkedIn
  • Telegram
  • FB
  • FB

Magazine Intelligenza Artificiale: l'IA è più di quello che appare

Magazine Intelligenza Artificiale: l'IA è più di quello che appare

MIT sviluppa DisCIPL per modelli linguistici più veloci ed economici

Immagine acquarellosa dai toni azzurri con scritta "LLM".

I ricercatori del MIT CSAIL hanno sviluppato DisCIPL, un nuovo framework che combina grandi e piccoli modelli linguistici per affrontare compiti di ragionamento complessi in modo più efficiente ed economico. Il sistema prevede che un modello di grandi dimensioni pianifichi la strategia di lavoro, poi suddivida compiti specifici tra modelli più piccoli, detti “follower”, guidandoli con regole precise codificate in LLaMPPL, un linguaggio di programmazione per il controllo dei LM.

Il metodo ha dimostrato capacità sorprendenti nella generazione di testi soggetti a vincoli rigorosi, come frasi con parole chiave in posizioni prestabilite, o in attività pratiche come la pianificazione di itinerari, la scrittura di liste della spesa e proposte di finanziamento. DisCIPL ha superato modelli avanzati come GPT-4o in accuratezza e coerenza, con tempi di ragionamento più rapidi del 40% e costi ridotti dell’80%.

Gli esperti sottolineano il potenziale del framework non solo per aumentare l’efficienza dei modelli linguistici, ma anche per migliorare trasparenza, controllabilità e parallelizzazione dei processi

Il team del MIT punta a espandere DisCIPL a compiti di ragionamento matematico e a scenari più complessi, con l’obiettivo di massimizzare l’uso di modelli più grandi disponibili senza incidere sui costi computazionali.

Leggi l’articolo completo: Enabling small language models to solve complex reasoning tasks su news.mit.edu

Immagine generata tramite DALL-E 3. Tutti i diritti sono riservati. Università di Torino (17/02/2025).

Esplora altri articoli su questi temi