un trampolino di lancio per l’intelligenza artificiale tradizionale e generativa

un trampolino di lancio per l’intelligenza artificiale tradizionale e generativa
un trampolino di lancio per l’intelligenza artificiale tradizionale e generativa
-

Questo metodo consente di creare set di dati di addestramento come desiderato. Ciò presenta un vantaggio significativo nelle aree in cui i dati di apprendimento sono scarsi.

L’intelligenza artificiale generativa ha dato origine a una nuova categoria di set di dati di addestramento: i dati sintetici. I modelli di fondazione permettono di partire da un piccolo numero di esempi per aumentarne artificialmente il volume allo scopo di fornire altri modelli che senza questo gioco di mano non avrebbero potuto vedere la luce. «Questa nozione è stata evidenziata nel 2023 dal laboratorio AI dell’Università di Stanford», ricorda Stéphane Roder, amministratore delegato della società di consulenza francese AI Builders.

L’intelligenza artificiale sintetica può essere utilizzata per la prima volta nell’apprendimento automatico. Secondo il principio di Vapnik, quanto più complesso è un modello di intelligenza artificiale tradizionale, tanto maggiori saranno i dati di addestramento necessari. Senza informazioni sufficienti non sarà in grado di generalizzare e le sue risposte risulteranno degradate. “Ma molto spesso ci troveremo di fronte al problema. E questo per molteplici ragioni. In molti casi, avremo un volume di dati molto limitato. Potrebbero anche essere di scarsa qualità o troppo vecchi. A volte non abbiamo l’autorizzazione a utilizzarli, poiché queste informazioni non sono rese anonime”, afferma Didier Gaultier, responsabile dell’intelligenza artificiale presso Orange Business Digital Services.

Una leva per il deep learning

L’approccio dell’intelligenza artificiale sintetica è particolarmente interessante per l’addestramento di modelli di deep learning. Reti neurali complesse che sono simili anche alle tecnologie di intelligenza artificiale generativa, anche se i data scientist concordano sul fatto che questa tecnologia rimane legata al campo dell’intelligenza artificiale tradizionale. “Nel campo del riconoscimento delle immagini, ad esempio, sarà necessario utilizzare migliaia di immagini per addestrare questo tipo di modello. E ovviamente sarà piuttosto raro avere tali contenuti a portata di mano”, riconosce Didier Gaultier.

Nell’ambito di un progetto realizzato per una ONG la cui missione è la riforestazione dei massicci corallini, Orange ha implementato una rete neurale artificiale volta a riconoscere, attraverso una telecamera subacquea, particolari tipologie di pesci. Obiettivo: verificare che la fauna selvatica stia effettivamente crescendo all’interno delle specie target. “La prima intelligenza artificiale implementata è riuscita a contare i pesci, ma non a riconoscerli, poiché il modello di deep learning sottostante non era sufficientemente addestrato”, indica Didier Gaultier.

“Possiamo iniziare da alcune auto di marche diverse con le relative specifiche, quindi generare un set di dati di diverse migliaia di immagini”

Come ha proceduto Orange Business? L’ESN ha utilizzato un generatore di immagini basato sulle foto delle principali aree interessate. Un generatore che moltiplicava queste foto mostrando i pesci in tutte le posizioni e morfologie possibili. “Abbiamo ottenuto decine di migliaia di immagini che ci hanno permesso di riqualificare la rete neurale. Alla fine, l’intelligenza artificiale è stata in grado di riconoscere tutte le categorie di pesci ricercate», sottolinea Didier Gaultier.

Tra i suoi principali vantaggi, l’intelligenza artificiale sintetica evita il lavoro di etichettatura manuale delle immagini. Nel caso del riconoscimento automobilistico, potremmo ad esempio partire con la stessa logica da alcune auto di marche diverse con le loro specifiche, per poi generare un data set di diverse migliaia di immagini che verranno taggate correttamente in base alle informazioni iniziali. Per ottenere questo risultato varieremo gli angoli di ripresa ma anche le condizioni atmosferiche. Stéphane Roder interviene: “Tuttavia non è possibile raggiungere la qualità dei dati etichettati manualmente”.

L’intelligenza artificiale sintetica può essere applicata anche ai dati tabulari. Questo metodo, tuttavia, richiede di essere molto più vigili. “Il ricorso a una regola matematica rischia infatti di introdurre distorsioni o correlazioni che non esistevano nei dati originali. Bisognerà quindi mettere in contatto scienziati di dati confermati o addirittura statistici per verificare la corretta attuazione del processo», avverte Didier Gaultier.

Dall’immagine al suono

L’intelligenza artificiale sintetica si applica anche al campo del video e del suono. Ad esempio, consentirà di riformulare i dati vocali in testo adattato al formato scritto. E viceversa. Conversioni che non possono essere realizzate senza l’intervento di un grande modello multimodale. Questo caso d’uso è particolarmente interessante per creare set di dati testuali dalle registrazioni del contact center e viceversa per addestrare, ad esempio, un chatbot audio utilizzando dati testuali raccolti da un database di clienti.

“È più che probabile che OpenAI abbia utilizzato i dati di Youtube per addestrare GPT4-o, sia nella sua versione audio che in quella testuale. Per quest’ultimo, la traccia audio del social network video è stata precedentemente convertita in testo, il che ha permesso di ampliare i dati di apprendimento”, spiega Didier Gaultier. E il consulente conclude: “Con l’intelligenza artificiale sintetica, le aziende si renderanno conto di avere miniere d’oro di dati che non sono sfruttabili nel loro formato originale, ma che grazie all’intelligenza artificiale generativa possono essere utilizzati nel cuore delle applicazioni”.

-

PREV la tomba ottagonale in definitiva non appartiene ad Arsinoe IV, sorella di Cleopatra
NEXT Airbus e jet evitano per un pelo la collisione all’aeroporto di Los Angeles