OpenAI Voice Engine: svolta o pericolo?

OpenAI Voice Engine: svolta o pericolo?
Descriptive text here
-

QCosa sappiamo di OpenAI Voice Engine? Infatti, OpenAI sviluppa modelli su vari media, dal testo al video, che possono addestrarsi su esempi per generare contenuti “originali” in base a una query. Questi modelli di intelligenza artificiale generativa alimentano i suoi prodotti di consumo, tra cui GPT per il testo, DALL-E per le immagini e Whisper per la trascrizione da audio a testo.

Voice Engine è un modello in fase di sviluppo in grado di esercitarsi sulla voce di un individuo e quindi leggere qualsiasi testo utilizzando quella voce. Immagina che Siri o l’Assistente Google leggano il contenuto di una pagina web, ma con la tua voce o quella di chiunque altro.

Tuttavia, abbiamo poche informazioni per giudicare le capacità di Voice Engine, oltre ai cinque esempi forniti da OpenAI. Sebbene sembrino impressionanti, probabilmente rappresentano scenari ideali e non risultati tipici. Tecnologie simili tendono a sembrare molto precise in alcuni casi, e vuote o robotiche in altri.

Nel suo blog, OpenAI ha affermato che il modello è stato testato da un piccolo numero di partner fidati in condizioni rigorosamente controllate e che non ha ancora deciso quando – e anche se – sarà disponibile al pubblico. Ha fornito questi dettagli nella speranza di avviare una conversazione sull’uso responsabile della tecnologia.

Il primo pericolo a cui spesso pensiamo quando veniamo a conoscenza di questa tecnologia è la disinformazione, e questa è una preoccupazione legittima. Supponendo che funzioni come sostiene OpenAI, un utente malintenzionato potrebbe prendere solo 15 secondi del discorso di qualcuno e creare una registrazione in cui dice quasi qualsiasi cosa. Le persone di alto profilo, come celebrità e politici, possono trovare tutte le informazioni sugli allenamenti di cui hanno bisogno con una semplice ricerca su Google.

In combinazione con il modello di generazione video di OpenAI, Sora, potrebbero progettare un video completamente falso con dialoghi. Anche se il risultato non fosse perfetto, o sembrasse un po’ strano, la tecnologia potrebbe comunque essere utilizzata per generare una disinformazione efficace.

Un’altra preoccupazione sono le truffe. Ma anche se i truffatori approfittano sempre di qualsiasi vantaggio tecnologico, non sono convinto che Voice Engine sarebbe un enorme vantaggio per loro.

In teoria, i truffatori potrebbero utilizzare la nuova tecnologia per mascherare gli accenti, parlando qualsiasi lingua in modo naturale per sembrare una persona del posto, ma non è chiaro come potrebbero farlo senza problemi in una conversazione in tempo reale. Potrebbero anche utilizzare un clone vocale per leggere il testo generato da un chatbot, automatizzando le truffe che inducono le persone a fornire le proprie informazioni personali. Ma questo è già possibile: l’aspetto rivoluzionario di Voice Engine è far sembrare il bot come una persona specifica.

Quale funzione legittima potrebbe svolgere?

Nonostante le preoccupazioni, questa tecnologia ha il potenziale per fare del bene. La conversione di qualsiasi testo in parlato umano presenta un chiaro vantaggio in termini di accessibilità, così come la traduzione istantanea. Ad oggi, le informazioni mondiali esistono in gran parte in varie lingue, con l’accesso determinato dalla lingua o dalla capacità di una persona di leggere, vedere o ascoltare. L’intelligenza artificiale potrebbe rendere tutte queste informazioni disponibili a tutti.

Il Voice Engine di OpenAI presenta anche alcuni potenziali vantaggi unici. Ad esempio, chiunque scriva contenuti potrebbe addestrare un modello della propria voce in pochi secondi, quindi rendere disponibile una versione audio del proprio lavoro a chiunque preferisca consumarlo in questo modo. Il risultato potrebbe essere letto emotivamente con la loro stessa voce, piuttosto che con una generica voce robotica.

Inoltre, i contenuti parlati potrebbero essere tradotti in qualsiasi lingua ma comunque letti con la voce dell’autore originale. Questo potrebbe essere utilizzato per contenuti inizialmente orali, ad esempio per rendere disponibili commenti televisivi, discorsi pubblici, video o podcast in tutte le lingue con poco lavoro aggiuntivo.

Sebbene le preoccupazioni circa il potenziale uso improprio della tecnologia Voice Engine siano legittime, è anche importante riconoscere i vantaggi che potrebbe apportare in termini di accessibilità e diversificazione delle informazioni. Un’implementazione responsabile e controllata è essenziale per ridurre al minimo i rischi potenziali e garantire un uso etico di questa tecnologia.

-

PREV Tracce di un giovane orso avvistate nella Bassa Engadina (GR)
NEXT Qual è il punto Nemo?