IL “Il coltellino svizzero del suono”. È così che Nvidia presenta la sua ultima innovazione nel campo dell’intelligenza artificiale. Fugattoabbreviazione di Foundational Generative Audio Transformer Opus 1, non si limita a generare musica o modificare voci come i suoi concorrenti. Questa versatile intelligenza artificiale può creare praticamente qualsiasi suono immaginabile, dal più semplice al più complesso, con un semplice comando di testo.
Uno studio di produzione in tasca
“Questa cosa è pazzesca”afferma entusiasta Ido Zmishlany, produttore multi-platino e co-fondatore di One Take Audio. Per questo professionista esperto, la capacità di creare istantaneamente nuovi suoni in studio apre nuove prospettive creative. Fugatto ti consente di prototipare rapidamente idee musicali, aggiungere o rimuovere strumenti da un brano esistente o persino modificare l’accento e l’emozione di una voce.
Iscriviti a Spremilimone
La storia della musica è strettamente legata al progresso tecnologico. “La chitarra elettrica ha dato vita al rock and roll. Quando è apparso il campionatore, è nato l’hip-hop”ricorda Zmishlany. “Con l’intelligenza artificiale stiamo scrivendo il prossimo capitolo della musica. Abbiamo un nuovo strumento, un nuovo strumento per fare musica. »
Un’intelligenza artificiale che capisce il suono come un essere umano
Rafael Valle, responsabile della ricerca audio applicata presso Nvidia e uno degli architetti del progetto, spiega: “Volevamo creare un modello che comprendesse e generasse suoni come gli esseri umani”. Questo approccio ha permesso di sviluppare capacità uniche. Ad esempio, Fugatto può far abbaiare una tromba o miagolare un sassofono.
Ancora più impressionante, il modello può generare paesaggi sonori che si evolvono nel tempo. Può riprodurre il suono di un temporale che attraversa una zona, con scoppi di tuono che si intensificano per poi sfumare gradualmente in lontananza. Il sistema permette anche di creare nuove transizioni, come un temporale che si calma per lasciare il posto al canto degli uccelli all’alba.
Tecnologia accessibile e versatile
Addestrato su milioni di campioni audio, Fugatto utilizza 2,5 miliardi di parametri e ha richiesto l’utilizzo di 32 GPU NVIDIA H100. Il suo sviluppo ha mobilitato un team internazionale di ricercatori per più di un anno, rafforzando le sue capacità multilingue.
Le potenziali applicazioni vanno ben oltre il quadro musicale. Gli strumenti per l’apprendimento delle lingue saranno in grado di personalizzare il proprio contenuto con qualsiasi voce scelta dall’utente. Gli sviluppatori di videogiochi saranno in grado di generare suoni dinamici che si adattano alle azioni del giocatore. Le applicazioni saranno ovviamente infinite.
- Nvidia lancia Fugatto, un’intelligenza artificiale in grado di creare o modificare qualsiasi suono dal testo
- Il modello può combinare istruzioni complesse per generare suoni nuovi ed in evoluzione
- Le app Fugatto porteranno la musica nel futuro
???? Per non perdere nessuna novità di Presse-citron, seguici su Google News e WhatsApp.
Related News :