Una nuova tecnica di “machine unlearning” potrebbe permettere ai sistemi AI di “disimparare” a imitare voci specifiche, rappresentando un potenziale strumento contro l’abuso dei deepfake audio. A suggerirlo è una ricerca guidata da Jong Hwan Ko e Jinju Kim dell’Università di Sungkyunkwan, presentata alla Conferenza Internazionale sul Machine Learning.
Il metodo è stato testato su una versione modificata di VoiceBox, modello vocale sviluppato da Meta. L’obiettivo era impedire la riproduzione fedele di alcune voci, anche su richiesta esplicita. Secondo i ricercatori, i risultati mostrano una riduzione dell’imitazione di oltre il 75% rispetto al modello originale, pur con un lieve calo (del 2,8%) nelle prestazioni sulle voci autorizzate.
A differenza dei comuni guardrail che bloccano l’accesso a contenuti sensibili ma non li rimuovono dal sistema, il “disapprendimento” tenta di eliminare del tutto le informazioni. Il processo richiede giorni di elaborazione e circa cinque minuti di audio per ogni voce da cancellare.
Leggi l’articolo completo: I programmi di sintesi vocale basati sull’intelligenza artificiale potrebbero “disimparare” a imitare certe persone su technologyreview.com.
Immagine generata tramite DALL-E 3. Tutti i diritti sono riservati. Università di Torino (26/11/2024).

