Questo mercoledì Google entra in quella che definisce “l’era degli agenti”. Il colosso digitale californiano lancia la seconda generazione della sua IA generativa Gemini. Gemini 2.0 è progettato per convincerti meglio a utilizzare l’intelligenza artificiale, attraverso agenti e assistenti più autonomi, più concreti e, in breve, più affidabili dell’attuale intelligenza artificiale generativa.
Inserito alle 10:30
Concretamente, Google metterà online da mercoledì una versione sperimentale di Gemini 2.0 Flash, la versione più leggera della sua IA generativa. È immediatamente accessibile tramite le interfacce di programmazione e formazione del modello linguistico AI Studio e Vertex AI. Verrà gradualmente integrato nell’applicazione Gemini nelle versioni mobile e personal computer.
Sarà anche questa nuova versione di Gemini che sarà integrata nel motore di ricerca Google e che produrrà i riepiloghi forniti nelle intestazioni dei risultati di ricerca.
Più fattuale
Nonostante tutto l’entusiasmo per applicazioni come ChatGPT, di OpenAI, e Copilot, di Microsoft, resta il fatto che l’intelligenza artificiale generativa è nel complesso molto imperfetta. Sia nel modo di generare testi che in immagini, gli manca ancora una buona dose di giudizio che gli impedirebbe a volte di scrivere o disegnare praticamente qualsiasi cosa. Questi scherzi, fino ad ora elegantemente descritti come “allucinazioni”, hanno limitato un’adozione più formale e diffusa degli strumenti di intelligenza artificiale, sia per il lavoro che per il tempo libero.
Con Gemini 2.0, Google promette di limitare meglio gli errori della sua intelligenza artificiale, il che lo renderà un assistente migliore, o addirittura un agente per l’utente. “Sarà più fattuale, il che lo renderà più utile per la ricerca online, e più multimodale”, ha riassunto Tulsee Doshi, direttore del progetto per Google DeepMind, tramite videochiamata. “Avrai anche un maggiore controllo sul modo in cui si esprime.” Ad esempio, oralmente, Gemini 2.0 parlerà in diverse lingue con otto toni di voce diversi, personalizzabili. Potresti chiedergli di “parlare come un pirata”. Gemini 2.0 genererà anche immagini basate su testo.
Questa versatilità consente di migliorare agenti come quello di Project Astra. Questo progetto è in realtà il prototipo di un assistente personale digitale alimentato dall’intelligenza artificiale. Si adatta al cellulare. Gli parli, punti la fotocamera del tuo telefono su un oggetto, un luogo o un documento e ti fornirà naturalmente molte informazioni rilevanti.
Basato su Gemini 2.0, Project Astra può ricordare i 10 minuti più recenti della tua conversazione e, per un maggiore contesto, può scavare nelle conversazioni precedenti. Questo agente fa bella figura sui dispositivi mobili, ma sarebbe un successo sugli occhiali connessi, un gadget con cui Google si destreggia già da diversi mesi e che potrebbe presto vedere la luce.
Dalla navigazione web ai videogiochi
Google ha mostrato altri tre esempi di agenti IA che sfruttano le prestazioni leggermente migliorate di Gemini 2.0. Il primo, chiamato Project Mariner, naviga sul Web per te e automatizza le attività ripetitive o noiose. Ad esempio, può raccogliere il modo migliore per contattare un elenco di aziende visitando i loro siti web uno per uno. Potrebbe arrivare al punto di fare acquisti per te, chiedendoti di intervenire solo quando è il momento di pagare.
Jules è un altro agente che si presenta come assistente di programmazione di computer. Questa non è una novità: Microsoft ha lo stesso tipo di strumenti nel proprio toolkit AI. Ma Jules sarebbe più bravo a individuare i bug nel codice e risolverli, lasciandoti libero sfogo per svolgere compiti più significativi.
Infine, Google pensa che Gemini potrebbe diventare un compagno di videogiochi. “Immagina un’intelligenza artificiale che ti aiuti a progredire nel gioco e ti dia consigli guardandoti giocare”, ha spiegato Rushil Mistry, un altro direttore del prodotto presso Google DeepMind. Più che un agente di intelligenza artificiale si tratta di un fratellino che vuole fare un po’ troppo, ma l’idea c’è: questa intelligenza artificiale potrebbe danneggiare tutti quei siti web specializzati in guide passo passo per i videogiochi.
E questo è solo un esempio tra tanti di ciò che Google spera sarà l’immediato futuro dell’intelligenza artificiale: l’era degli agenti.