OpenAI ha reso disponibile anche in Italia la funzione Live Vision di ChatGPT, che consente all’IA di analizzare e commentare un flusso di immagini in tempo reale.
Questa novità, riservata inizialmente solo agli utenti abbonati, permette di utilizzare la fotocamera dello smartphone per ottenere spiegazioni immediate su oggetti o scenari inquadrati. OpenAI dichiara che la tecnologia non riconosce i volti, ma offre nuove possibilità di interazione visiva e vocale. Ad esempio, puntando la fotocamera su un oggetto, come un cellulare o una televisione, è possibile ricevere dettagli sul suo modello e caratteristiche. Questo vale anche per edifici e luoghi, oppure per le condizioni meteo. Questa modalità è in grado di passare rapidamente da un argomento all’altro semplicemente cambiando ciò che viene inquadrato. Tuttavia, sembrerebbe che l’IA mostri ancora dei limiti nella comprensione visiva del mondo, con risposte che possono essere imprecise, errate o rallentate.
Microsoft e Google stanno seguendo lo stesso percorso, potenziando i loro agenti AI con capacità visive e vocali. Microsoft ha introdotto Copilot Vision, che analizza contenuti sullo schermo e offre spiegazioni contestuali. Google ha invece recentemente lanciato Astra, un assistente multimodale compatibile con dispositivi come smartphone e occhiali smart, segnando il ritorno nel settore degli smart glasses.
Leggi l’articolo completo: ChatGpt ora può “vedere” anche in Italia: come funziona la nuova frontiera dell’IA su lastampa.it.
Immagine generata tramite DALL-E 3.

